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Las pruebas psicoldgicas comenzaron como una 
insignificante empresa en los laboratories aca- 
demicos de los psicologos europcos del siglo 
xix. A partir de este nacimiento poco propicio, 
su practica proliferd a lo largo dc todo el mun- 
do industrializado a un paso cada vez mas ace- 
lerado. Como descubnrd el lector dentro de las 
pdginas de este libro, las pruebas psicoldgicas 
tienen en la actualidad un impacto en casi todos 
los dmbitos dc la vida moderna, desde la edu- 
cacidn, pasando por la vocacidn, hasta la regu¬ 
lar! zacidn. 


'$1 PROPbsrro del ubro 


La tercera edicidn en inglds (la. en espanol) de 
este libro se basa en las mismas suposiciones 
que las versiones antcriores. Su ambicioso 
propdsito consiste en proporcionar al lector cl 
conocimicnto acerca de las caracteristicas, ob- 
jetivos y efectos de amplio rango de la trasccn- 
dental empresa de las pruebas psicoldgicas. En 
la busqueda de esta meta sc han incorporado 
ciertas tradiciones muy conocidas, pero tarn- 
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bidn sc ha procedido hacia algunas direction®, 
nuevas. Por cjemplo, cl libro trata cl tema comun 
dc las normas, estandarizacidn. confiabilidad, 
validez y consUuccidn de prucbas; tambidn sc 
analiza un compendio dc pruebas y medidas en 
Areas tradicionales como las prucbas intelectua- 
les, de rcndimicnio, industriales-organizacionales, 
vocacionales y dc personalidad. 

CAR ACTERISTICAS ESPECIALES 

AdemAs dc los temas iradicionales quc sc listan 
antes, sc enfatizan cicrtas cuestiones, temas y 
conccptos quc se consideran csenciales para 
una comprensidn profunda dc las prucbas psi- 
col6gicas; por ejemplo, el libro inicia con un 
capftulo acerca dc la historia de dstas, y subra- 
ya la perspectiva de que la historia de las pruc¬ 
bas psicoldgicas cs de importancia para las 
prActicas actuales. Es tfpico que los estudian- 
tes de psicologfa rchuyan las cuestiones histd- 
ricas dcbido a quc. a menudo. sc les presenta 
de manera aburrida, dcsprovistas dc relevancia 
para la actualidad. Sin embargo, se espera que 
el lector escdptico aborde estc capftulo con una 
mente abierta —pues se ha hecho un gran es- 
fucrzo en haccrlo interesante y rdcvante. 

Las pruebas psicoldgicas representan un 
contrato cntrc dos personas. Una de ellas —el 
examinador—generalmente ocupa una posicidn 
de podcr por encima de la otra —la persona 
evaluada. Por tal razdn, el examinador necesita 
enfocarlas con la mayor sensibilidad hacia las 
neccsidades y dcrechos del individuo examina- 
do. Para enfatizar esta cuestidn crucial, se ha 
dcdicado uno dc los primeros capftulos a los 
elementos sutiles del proceso de prueba, inclu- 
yendo cuestiones como el establecimicnto del 
rapport y la vigilancia dc las influencias am- 
bientales indeseables sobre los resultados de 
prueba. El ultimo tema en el libro tambidn 
enfatiza la naturalcza contractual de la cvalua- 
cidn al revisar las cuestiones profesionales y 
normas dticas cn la aplicacidn dc pruebas. 

Otro tema que se destaca en esle libro es la 
evaluacidn neuropsicoldgica, un subcampo flo- 
rcciente de la psicologfa clfnica que en la ac¬ 


tualidad es una especialidad bicn establecida con 
dercchos propios. La evaluacidn ncuropsicold- 
gica es, en defmitiva, un Area crcciente y hoy 
en dfa constituye una de las principals aplica- 
cioncs de las pruebas psicoldgicas; se ha dcdi¬ 
cado un capftulo completo a esta importante 
materia. Para que el lector pueda apreciar me- 
jor el cspectro y propdsito de la evaluacidn 
neuropsicoldgica, se inicia cl capftulo con una 
reseda sucinta dc los principios neuropsicold- 
gicos antes de analizar los instrumentos espe- 
cfficos. Esta revisidn introduce conccptos 
importantes en la evaluacidn neuropsicoldgica, 
como la relacidn entre la disfuncidn cerebral 
localizada y los sfntomas conductuales espeef- 
ficos. Sin embargo, los lectorcs que nccesiten 
dejar a un lado la scccidn sobre los fundamcn- 
tos ncuroldgicos de la conducta pueden hacer- 
lo con una pdrdida minima —la seccidn sobre 
pruebas y procedimientos neuropsicoldgicos es 
comprensible de manera independiente. 

£ste es mAs que un libro sobre pruebas y 
sus confiabilidades y valideces. Tambidn sc 
exploran muchas cuestiones con gran valor 
que se relacionan con el conocimienlo acerca de 
las prucbas. Las pruebas psicoldgicas son po- 
ldmicas precisamente debido a que sus conse- 
cucncias pueden serdafiinas, con toda seguridad 
para los individuos y quizA tambidn para todoel 
entramado social. No se han evadido las con- 
troversias que rodean su empleo. Temas indc- 
pendientes estudian las contribucioncs gendricas 
y ambientales a la intcligencia, los orfgcncs de 
las diferencias raciales en Cl, la parcialidad 
de prueba y las preocupaciones externas a la 
validez, el falseamiento de resultados en prue¬ 
bas grupales de rendimiento, cl testimonio en 
tribunales y las cuestiones dticas relacionadas 
con las prucbas psicoldgicas. 

nota sobre los ejemplos de caso 

Esta edicidn continua utilizando historias clfni- 
cas y vifietas que presentan conceptos sobre 
las pruebas e ilustran la aplicacidn ocasional- 
mente abusiva dc las pruebas psicoldgicas. Es- 
tos ejemplos se colocan en "apartados y se les 
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denomina Ejcmplos de Caso. La mayor parte 
se basan en experiencias personates mas que 
en trabajos acadenncos. Todas estas historias 
clinicas son reales; sucedieron en realidad —to 
se porquc tengo conocimiento dirccto sobre la 
veracidad dc cada andcdota. Estas cucstioncs 
merecen que se les destaque porque es proba¬ 
ble que al lector le parezca que algunas son fran- 
camente un producto de la fantasia y casi mas 
all£ de todo crddito. Por supuesto, a fin de ga- 
rantizar cl anonimato de las personas e institu- 
cioncs, sc han alterado ciertos detallcs poco 
csenciales y se conserva la idea general b&sica 
dc los acontecimientos originates. 


CAMBIOS CON RESPECTO A LA 
SEGUNDA EDIQbN EN INGLES 


Por supuesto, una edicidn revisada se esforza- 
ria en anadir las ultimas conclusioncs acerca 
de pruebas especificas y en incorporar nuevos 
conceptos a los anteriores. Aquf sc han hecho 
ambas cosas. Por ejcmplo, en los ultimos ados 
se han revisado muchas pruebas (WAIS-III, 
Leiter-R, SIB-R, para nombrar s6lo algunas), y 
en este libro se han descrito las ediciones mds 
recicntcs y resefiado la invcstigacidn rclcvante. 
Tambidn, algunos conccptos han atravesado por 
una rcinterpretacidn, por lo que se han incluido 
las perspectivas mds novedosas sobre ellos. Un 
caso es la prueba alfa de Cronbach, que en ge¬ 
neral se interpreta como un indice de la unidi- 
mensionalidad dc una prueba o escala, pero 
ahora se considera como un indice dc la homo- 
geneidad de los reactivos (y no necesariamente 
como una medida de la unidimensionalidad de 
la prueba o escala). 

Ademds de actualizar las pruebas y con¬ 
ceptos, la tercera edicidn en inglds presenta al¬ 
gunos cambios en cobertura de temas; los 
importances son los siguientes: 

1. Las diferentes cvaluaciones basadas en la es- 
cuela se han agrupado en el Tema 10A: Eva- 
luacidn escolar. 


2. Se aumentd la cobertura sobre cvaluacidn 
forense; sc csludia en el Tema 10B, Aplica- 
cioncs forenscs de la evaiuacidn. 

3. Por primera vez se incluye la evaluacidn es- 
piritual y religiosa en el Tema I2B: Valorcs 
en el desarrollo moral, cspiritual y religioso. 

4. Las prcdiccioncs sobre cl futuro dc las prue¬ 
bas sc han incluido en el Tema ISA: Evalua¬ 
cidn por computadora y el futuro de las 
pruebas. 

5. Sc aumentd el cstudio acerca de las cuestio- 
nes dticas y socialcs cn el Tema 15B: Cues- 
tiones dticas y socialcs en las pruebas. 

i ESQUEMA DEL LIBRO 


ORGANIZACION TEMAT1CA 

Para orientar al mayor publico posible, se ha 
incorporado un esquema que divide el gigan- 
tesco campo dc las pruebas psicoldgicas —su 
historia, principios y aplicaciones— cn 30 te¬ 
mas pequenos, manejables y modulares. Es 
asombroso descubrir que, en general, los 30 
temas sc agrupan en pares; asi, el lector notard 
que cl libro tambidn se organiza en una serie 
ordenada de 15 capitulos con dos temas cada 
uno. El formato de los capitulos ayuda a identi- 
ficar los pares de temas que se relacionan, y 
reduce la nccesidad dc prcdmbulos redundantes 
para cada tema. 

La unidad mas fundamental e indivisible del 
libro es el tema. Cada uno ticnc una posici6n 
independiente y cl lector cncuentra en ellos un 
numcro mancjable de conceptos y la resena de 
pruebas. Para el estudiante, la ventaja de la or- 
ganizacion tematica es que los temas individua¬ 
tes son suficicntcmcnte pcquehos como para 
lecrlos de una sola vez; para el instructor, la 
ventaja es que las materias que se consideran 
de menor importancia sc pueden eliminar con 
facilidad de la lista de lecturas. Por supuesto, 
preferiria que todos los estudiantes leyeran to- 
dos los temas, pero hay que scr realista. Con 
frccucncia se rcquicre un texto condensado por 
razoncs pnlcticas, como la longitud del periodo 
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escolar. En esos casos, cl instructor tendr£ faci- 
lidad para establecer un subconjunto de temas 
que satisfagan las necesidades curriculares de casi 
cualquier curso sobre pruebas psicolOgicas. 

ESQUEMA BASICO 

Los 15 capftulos sc dividcn en seis fireas am- 
plias, como se prescnta a continuation: 

Historia 

Capftulo 1. Historia de las pruebas psicolOgicas 
Tema 1A. Orfgenes de las pruebas psi¬ 
colOgicas 

Tema IB. Primeras pruebas en EUA 

Fundamentos 

Capftulo 2. Pruebas y su proeeso de aplicaciOn 
Tema 2A. Naturaleza y usos de las prue¬ 
bas psicolOgicas 
Tema 2B. Proeeso de aplicaciOn 
Capftulo 3. Normas y confiabilidad 
Tema 3A. Normas y cstandarizaciOn 
Tema 3B. Conceptos de confiabilidad 
Capftulo 4. Validcz y desarrollo de pruebas 
Tema 4A. Conceptos b£sicos de validez 
Tema 4B. Construction de pruebas 

Pruebas de inteligencia y de capa- 
cidad 

Capftulo 5. Pruebas de inteligencia I: Teo- 
rfas y evaluation preescolar 
Tema 5A. Teorfas y mediciOn de la intc- 
ligencia 

Tema 5B. Evaluation de las capacida- 
des de lactantes y preescolares 
Capftulo 6. Pruebas de inteligencia II: Prue¬ 
bas individuates y grupales 
Tema 6A. Pruebas individuates de inteli¬ 
gencia 

Tema 6B. Pruebas grupales de inteligencia 
Capftulo 7. Sesgo de una prueba y examen 
de poblaciones especiales 
Tema 7A. Pruebas con poblaciones es- 
peciales 

Tema 7B. Sesgo de una prueba y otras 
controversias 


Capftulo 8. Pruebas grupales de aptitud y 
de rendimiento 

Tema 8A. Pruebas de aptitud y antiisis 
factorial 

Tema 8B. Pruebas grupales de rendimiento 

ApKcodones especializadas 

Capftulo 9. Evaluation ncuropsicolOgica y 
geriatrica 

Tema 9A. Compendio de neuropsicologfa 
Tema 9B. Evaluation ncuropsicolOgica 
y geriatrica 

Capftulo 10. Ambientes especiales para la 
evaluation psicolOgica 
Tema 10A. EvaluaciOn escolar 
Tema 10B. Aplicaciones forenses de la 
evaluation 

Capftulo 11. EvaluaciOn industrial y orga¬ 
nizational 

Tema 11 A. EvaluaciOn y selection de 
personal 

Tema 11B. valoraciOn del desempefio en 
el trabajo 

Capftulo 12. EvaluaciOn vocational y de 
valores 

Tema 12 A. EvaluaciOn de intereses y va¬ 
lores de trabajo 

Tema 12B. Valores en el desarrollo mo¬ 
ral, espiritual y religioso 

Pruebas de personalidad 

Capftulo 13. Orfgenes de las pruebas de 
personalidad 

Tema 13A. Teonas y mediciOn de la per¬ 
sonalidad 

Tema 13B. TOcnicas proyectivas 

Capftulo 14. EvaluaciOn cstructurada de la 
personalidad 

Tema 14A. Inventarios de autoinforme 
Tema 14B. EvaluaciOn conductual yen- 
foques relacionados 

Evaluation por computadora y 
aspectos profesionales 

Capftulo 15. Temas y cucstiones especia- 
les en las pruebas 

Tema 15A. EvaluaciOn por computado¬ 
ra y el futuro de las pruebas 
Tema 15B. Cuestiones Oticas y socialcs 
en las pruebas 
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El libro tambi6n presenta un extenso glosario, 
apdndices para localizar las pruebas y sus edito- 
riales —destacando el Apendice A; principales 
hitos en la historia dc las prucbas psicol6gicas— 
y una tabla para convcrtir rangos percentiles a 


equivalences en puntuacidn estdndar y estan- 
darizada. Por supuesto, para satisfacer sus nc- 
cesidades personates, los lectores y los instruc- 
tores del curso pueden elegir entre estos temas 
para satisfacer sus necesidadcs. 
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La historia de las pruebas psicoldgicas 
cs fascinante y ticne gran relevancia para las 
prActicas actuales. Despu^s de lodo, las prue¬ 
bas contcmporiineas no surgieron de un vacfo; 
evolucionaron lentamente a parti r de una mul- 
titud de precursores que desfilaron a lo lai 7 >o 
de los ultimos 100 ados. En vista de ello, estc 
capftulo presenta una revisidn de las rafces his- 
tdricas de las pruebas psicoldgicas actuales. El 
tema 1A: Orfgenes de las pruebas psicoldgi- 
cas, sc centra en gran medida en los esfucrzos 
de los psicdlogos europeos para medir la inteli- 


gencia durante la ultima parte del siglo XIX y la 
dpoca anterior a la primera Guerra Mundial. 
Con frecuenda. estas primeras pruebas de in- 
teltgcncia y sus sucesoras ejercicron podcro- 
sos efectos sobre los indi viduos exarrunados con 
ellas. de modo que el primer tema tambien in¬ 
corpora un pardntesis breve que documcnta la 
importancia de los resultados de las pruebas psi- 
cologicas. El tema IB: Primeras pruebas en 
EUA, cataloga las numcrosas pruebas desarro- 
lladas por los psicdlogos estadounidenscs en la 
primera mitad del siglo XX. 
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Las pruebas psicol6gicas en su forma ac¬ 
tual se originaron hace poco mds dc 100 afios 
en los estudios de laboratorio sobrc discrimi- 
nacidn sensorial, habilidades motoras y tiempo 
de reaccidn. El gcnio britanico Francis Gallon 
(1822-1911) inventd la primera balcrfa de prue¬ 
bas, un conjunto peculiar de mcdidas senso- 
riales y motoras que se rcvisard mis adelantc. 
El psicdlogo cstadounidense James McKeen 
Cattell (1860-1944) estudid con Gallon y des¬ 
puds. en 1890, estipuld los temas esenciales de 
las pruebas modernas en su artfculo clasico ti- 
tulado Mental Tests and Measurements. Se 
mostrd cauto y modcsto al describir los propd- 
sitos y aplicaciones de sus instrumentos: 

La psicoiogfa no puede lograr la certtdumbre y 
oxactitud de las ciencias llslcas, a menos que se 
fundamente en los experimentos y la medicldn. 

Se puede dar un paso en dlcha direcckin al apll- 
car una sene de pruebas y medidas mentales a 
un gran numero de Individuos. Los resultados 
tendrlan un valor cientflico considerable en el 
descubrlmlenlo de la constancia de los procesos 
mentales, su interdependencla y su varlactbn 
bajo circunstanclas diferentes. Adeinas, los 
individuos enoonlrarian sus pruebas interesan- 
tes y. quizS. utiles con respecto al entrenamien- 
to, modo de vtda o Indicacibn de enfermedad. 

El valor cienlifico y practico de dichas pruebas 
aumentaria en gran medida si se adoptara un 
slstema uniforms, de modo que pudieran com- 
pararse y combinarse las determinaciones 
reallzadas en diferenles momentos y lugares 
(Cattell, 1890). 

La conjctura dc Cattell de que "quizd" las prue¬ 
bas podrfan scr utiles en “el entrenamiento, 
modo de vida o indicacidn de enfermedad" dcbe 
clasificarse con toda seguridad como una dc las 
subestimaciones profdticas mis notables dc to- 
dos los tiempos. Cualquier persona criada en cl 
mundo occidental sabe que las pruebas psico¬ 
ldgicas han surgido de sus tfmidos inicios para 
volversc un gran ncgocio y una institucidn cul¬ 
tural que permea a la sociedad moderna. Para 
citar tan sdlo un ejcmplo, considdresc el numc- 
ro de pruebas estandarizadas dc rendimiento y 
capacidad aplicadas en los sistemas escolares 
de EUA. Aunque es diffcil obtener datos exac- 
tos en cuanto a la cantidad de dichas pruebas, 


es probable que no sea exagerado estimar 200 
millones por ano (Medina y Neill, 1990). Por 
supucsto, el numero total dc pruebas aplicadas 
anualmcntc lambidn incluyc millones de prue¬ 
bas de personal idad y cantidadcs incontables 
de miles de otros tipos de pruebas que existen 
en la actualidad (Conoley y Kramer, 1989, 
1992; Mitchell, 1985; Swectland y Keyser, 
1987). No hay duda de que las pruebas son un 
mdtodo generalizado, pero /cslo causa algun 
impacto? 

i IMPORTANCE DE LAS PRUEBAS 


Las pruebas se utilizan en casi todos los pafses 
con propdsitos de orientacidn psicoldgica, sc- 
leccidn y asignacidn. Su aplicacidn ocurre en 
entomos tan diversos como escuelas, servicio 
publico, industria, clfnicas medicas y centros 
de orientacidn psicoldgica. La mayorfa de las 
personas han tornado docenas de pruebas y no 
lc dan gran iniportancia al asunto. Sin embar¬ 
go, para cl momento en que el individuo tfpico 
llega a la edad dc retiro, es probable que los 
resultados de las pruebas psicoldgicas hayan 
ayudado a moldear su dcstino. Los cambios en 
el curso de la vida debidos a los resultados dc 
pruebas psicoldgicas podrfan ser sutiies, como 
ocurre cuando un futuro matemitico accede a 
un curso de cilculo avanzado con base en cali- 
ficaciones de rendimiento del primer ano de 
preparatoria. Es mas comun que los resultados 
dc pruebas psicoldgicas altercn el destino indi¬ 
vidual de manera profunda. El que se aceptc a 
una persona en una universidad y no en otra; 
que se le ofrczca un empleo, pero se le rechace 
en olro; se le diagnostique como deprimido o 
no, todas estas determinaciones dependen, al 
menos en parte, de la interprctacidn de los 
resultados de pruebas que realizan individuos 
con autoridad. Dicho en tdrminos sencillos, 
los resultados dc las pruebas psicoldgicas cam- 
bian la vida. Por tal razdn es prudente —y, de 
hccho, casi obligatorio— que los estudian- 
tes de psicoiogfa aprendan ace tea de los usos 
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Ejemplo DE CASO1-1 

CONSECUENCIAS DE LOS RESULTADOS DE PRUEBA 


La importancla de las pruebas psicoldgicas se iluslra mejor con un ejemplo. Conslddrense las 

siguienles vlnolas breves: 

• Una nifia tfmida y reiralda de siete alios de odad reclbe una prueba de Cl qua le apllca un 
pslcdlogo educatlvo. Su puntuacidn es mucho mds alia de lo que el maestro esperaba. Se 
admlte a la alumna en un programs para niiios dotados y talentosos donde florece hasta 
converllrse en una estudlante conllada en sf misma y gregarla. 

• Tres nifios de una famllla que vive cerca de una fundlcldn de plomo se ven expuostos a los 
efectos (dxicos del polvo de plomo y sufren dafio neuroldgico. En parte, con base en los 
resullados de una prueba psicoldglca que demueslran alteracidn en la Inlellgencia y una bre¬ 
ve capaddad de atencidn en los niiios, la (amllia redbe una compensacidn de 8 millones de 
ddlares (EUA) de parte de la compafila que es proplelaria de la fundicldn. 

• A un candidalo al pueslo de oficlal de pollcla so lo apllca un invenlario de personalidad como 
parte del proceso de seleccldn. La prueba Indlca que el candidato tiende a acluar sin pensar y 
resiste la supervlsldn de parte de figuras de autoridad. Aun cuando tiene un entrenamiento 
excelenle e impreslona a los entrevistadores, el candidalo no redbe la oferta de trabajo. 

• Una estudiante, insegura de cudl carrera debe seguir, responds un inventario de intereses 
vocacionales. La prueba Indica que deberla irabajar como farmacdutica. Se Inscribe en un 
curso propeddutico de qulmica farmacdutica, pero encuentra que las clases son tanto diddles 
como aburrida3. Despuds de Ires anos abandons esta carrera para tomar una de danza, 
(ruslrada por el becho de que lodavfa enfrenta tres anos adicionales en la universidad para 
oblener el Ktulo. 

• Un sollcilanle a una escuela de posgrado en psicologla cllnica contests el Invenlario Multifdslco 
de Personalidad (MMPI). Sus recomendaciones y promedio de calificaciones son notables, 
sin embargo, debe pasar el ultimo obstdculo que represents el MMPI. Sus resultados son 
razonablemente normales, pero un tanto defensivos; en una estrecha votacidn, el comitd de 
aceptacidn le extiende una invilacldn. Irdnicamente, dsla es la unica escuela de posgrado que 
lo admits —otras 19 lo rechazan. Acepta la invitacidn y se fascina con el estudio de la evalua- 
cidn psicologica. Muchos anos despuds, escribe este libro. 


actualcs y de los abusos ocasionales en la 
aplicacidn dc pruebas. En el ejemplo de 
caso 1-1 se ilustran los cambios de vida que 
son consecucncia de las pruebas psicoldgicas 
a travds de varias muestras dc historias clfni- 
cas verdaderas. 

La importancia de las pruebas tambidn es 
cvidente desde la perspectiva de una revisidn 
histdrica. En general, los estudiantes de psico¬ 
logla consideran los temas histdricos como abu- 
rridos, aridos y diffciles y, en ocasiones, dichos 


prcjuicios cstdn bien justificados. Despuds de 
todo, muchos libros de texto no logran explicar 
la relevancia de las cuesliones histdricas y pro- 
porcionan sdlo bocetos vagos dc los desarro- 
llos iniciales en las pruebas mentales. Como 
resultado, es frccucnte que los alumnos de psi- 
cologia concluyan de manera incorrecta que los 
temas histdricos son aburridos e irrclcvantes. 

En realidad, la historia de las pruebas psi¬ 
coldgicas es fascinante y tiene relevancia sus- 
tancial para las prdcticas actuates. La evolucidn 
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historica cs pertinenie para las prucbas con- 
temporincas debido a las siguientes razones: 

1. Una revisidn dc los orfgenes dc las pruebas 
psicoldgicas ayuda a explicar pricticas ac- 
luales que, de oira mancra, podrfan parccer 
arbitrarias e incluso peculiares. Por cjcmplo, 
^por qui muchas pruebas de intcligencia 
actuates incorporan una capacidad en apa- 
riencia no inteleclual como la memoria a 
corto plazo de dfgitos? La rcspuesta es, en 
parte, la inercia histdrica —las pruebas dc 
inteligencia siempre han incluido una mcdi- 
da de rctencidn de dfgitos. 

2. El poder y las limitaciones dc las pruebas 
tambiin resaltan con mayor facilidad cuan- 
do dichos mdtodos se observan dcntro de un 
contcxto histdrico. Porcjemplo.el lector des- 
cubriri que las pruebas de inteligencia mo- 
dernas son excepcionalmcntc buenas para 
pronosticar cl fracaso en la escuela, debido 
precisamentc a que dste fue el propdsito ori¬ 
ginal y tinico del primero de dichos instru- 
mentos desarrollado cn Parts. Francia, a 
principios de este siglo. 

3. Por ultimo, la historia de las pruebas psico- 
Idgicas contiene algunos episodios tristes y 
lamentabies que ayudan a recordar que no 
se debe ser demasiado vehemente en el uso 
que en la actual idad se da a las pruebas. Por 
ejcmplo. con base en la aplicacidn insensata 
y prcjuiciada de los resultados de prue¬ 
bas de inteligencia, varios psicdlogos dcsta- 
cados ayudaron a aprobarel Decretode 1924 
de Restrict'idn a la Inmigracidn (Immigration 
Restriction Act .>/ 1924). 

En capftulos posteriores se analizarin los prin¬ 
cipios de las prucl .* , ticoldgicas, se investi- 
garan las aplicaciones a campos especfficos 
(p. ej.. personalidad. inteligencia, neuropsi- 
cologfa) y se reflexionari acerca dc las conse- 
cuencias sociales y legalcs dc las pruebas. Sin 
embargo, el lector encontrari que estos temas 
son mis comprcnsibles cuando sc les analiza 
en un contcxto histdrico. Asf, por el momento, 
sc comcnzari por la revision de las formas ru- 
dimentarias de prueba que exislieron hace mas 
de 4 000 afios en la China imperial. 


S FORMAS RUD1MENTARIAS 
DE LAS PRUEBAS EN CHINA 
EN EL ANO 2200 a.O 


Aunque el emplco extendido de las pruebas 
psicoldgicas es, cn gran medida, un fendmeno 
del siglo XX, los historiadorcs sefialan que las 
formas rudimentarias de las pruebas datan de, 
cuando menos, cl ado 2200 a.C., cuando el 
emperador chino hizo que se examinara a sus 
oficiales de gobiemo cada tercer ano para dc- 
terminar su idoneidad para el pucsto (Chaffee, 
1985; DuBois, 1970; Franke, 1963; Lai. 1970; 
Teng, 1942-43). Dichas pruebas sc modifica- 
ron y perfeccionaron a lo largo de siglos hasta 
que se introdujeron eximenes por escrito du¬ 
rante la dinastfa Han (202 a.C.-200 d.C.). Se 
sometfa a prueba cn cinco temas: ley civil, asun- 
tos militarcs, agricultura, contribucioncs y geo- 
graffa. 

El sistema de examcn chino adquirid su for¬ 
ma final aproximadamente en 1370, cuando se 
enfatizd la dcstreza en los clisicos escritos de 
Confucio. En el examen preliminar se pedfa a 
los candidatos que pasaran un dfa y una noche 
en una pequefta cabina aislada, componiendo 
ensayos sobre temas asignados y escribiendo 
un pocma. De I a 7% que aprobaban continua- 
ban con los eximenes por distrito, que reque- 
rfan tres scsiones independientes dc ires dfas 
con sus noches. 

Como es obvio, estos eximenes eran exle- 
nuantes y rigurosos, pen) 6ste no era el ultimo 
nivel. De I a 10% de los individuos que apro¬ 
baban tcnian el privilegio dc ir a Pekfn para la 
ronda final de eximenes. Quizi 3% de este ul¬ 
timo grupo aprobaba y lograba el pucsto de 
mandarin, clegible para el servicio publico 

Aunque los chinos dcsarrollaron la para- 
fernalia para un programa amplio de eximenes 
del servicio publico, las semejanzas entre sus 
tradiciones y las pricticas actuales dc prueba 
son supcrficiales en cuanto a lo csencial. Sus 
pricticas de prueba no s6lo eran innecesaria- 
mente agoladoras, sino que los chinos tampo- 
co validaron sus procedimientos de seleccidn. 
Sin embargo, parecc ser que el programa de 
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exdmenes incorporaba criierios pertinentes para 
la seleccidn. Por ejemplo, en los exdmenes es- 
critos, la bellcza de la caligraffa tenia un peso 
muy importante. Dadas las caracterfsticas su- 
mamente estih'sticas de las formas de escritura 
china, sin duda la buena caligraffa era cscncial 
para la comunicacidn clara y exacta. Asf, es 
probable que la caligraffa fucra un mecanismo 
pertinente de prediccidn para cl cmpleo en el 
scrvicio publico. En respuesta al amplio des- 
contento. el sistema de examen se abolid por 
dccreto real en 1906 (Franke, 1963). 


S ANTECEDENTS PSIQUiATRICOS 
DE LAS PRUEBAS PSICOL6GICAS 


La mayorfa de los historiadores ubican el co- 
mienzo de las pruebas psicoldgicas en la invcs- 
tigacidn experimental sobrc diferencias 
individualcs que florecid en Alemania y Gran 
Bretaha a finales del siglo xix. No hay duda de 
que los primeros cxpcrimentalistas como 
Wilhelm Wundt, Francis Gallon y James 
McKeen Cattcll cstablccieron los fundamentos 
para las pruebas del siglo XIX y se revisardn en 
dctallc algunas de sus contribuciones. Pero las 
pruebas psicoldgicas le deben tanto a la prime- 
ra psiquiatrfa como a los laboratories de psicolo- 
gfa experimental. De hecho, el examen de los 
enfermos mentales aproximadamentc a media- 
dos del siglo XIX resultd en el desarrollo de 
muchas dc las primeras pruebas (Bondy, 1974), 
las cuales mostraban la ausencia de cstandari- 
zacidn y, en consccuencia, se relegaron al olvi- 
do. Sin embargo, influyeron en la determinacidn 
del curso de las pruebas psicoldgicas, de modo 
que es importante mcncionar algunos avanccs 
tfpicos de esta dpoca. 

En 1885, el medico alemin Hubert von 
Grashey desarrolld el antecedente del cilindro 
mncmdnico como un medio para examinar a 
pacientcs con lesidn cerebral. Se les mostra¬ 
ban a los sujetos palabras, sfmbolos o ilustra- 
ciones a travds de una ranura en una hoja de 
papel que se movfa lentamente sobre los eslf- 
mulos.Grashey cncontrd que muchos pacien- 


tes podfan reconocer los estfmulos completos. 
pero no identificarlos cuando se mostraban a 
travds de la ranura en movimiento. Poco des¬ 
puds, cl psiquiatra alem.ln Conrad Rieger desa¬ 
rrolld una baterfa dc pruebas excesivamente 
ambiciosa para la deteccidn del dado cerebral, 
la cual requerfa mas de 100 horas para su apli- 
cacidn, por lo que pronto cayd su aceptacidn. 

En resumen, la psiquiatrfa inicial contri- 
buyd al movimiento de las pruebas men¬ 
tales al mostrar que los proccdimientos 
estandanzados pueden ayudar a rcvelar la na- 
turaleza y grado de los sfntoma er pacicntes 
con enfermedades mentales y con lesidn cere¬ 
bral. La mayorfa dc las primeras pruebas desa- 
rrolladas por los psiquiatras sc quedaron en el 
ol vido, pero se cstandarizaron unoscuantos pro- 
cedimientos y sc les conserva en variacioncs 
modernas (Bondy, 1974). 


ERA DE LOS INSTRUMENTOS 
1' DE BRONCE DE LAS PRUEBAS 


La psicologfa experimental florccid a finales del 
siglo XIX en la Europa continental y Gran Bre- 
tafia. Por primera vez en la historia, los psied- 
logos se alejaron de los mdtodos lotalmentc 
subjetivos e introspectivos que se habfan segui- 
do de manera tan infructuosa en siglos anlerio- 
res. En lugar de ello, las capacidades humanas 
sc sometieron a prueba en laboratorios. Los in- 
vestigadores utilizaron procedimientos objeti- 
vos que tenfan posibilidad de replicarsc. Lejos 
quedaron los dfas en que laboratorios rivales 
tenfan grandes discusiones acerca del "pensa- 
miento sin imdgenes", donde un grupo afirma- 
ba que existfa, mientras otro deefa que tal 
acontecimiento mental era imposible. 

Aunque el nuevo entasis en los mdtodos 
objeti vos y las cantidades medibles era una gran 
mejorfa sobre el mcntalismo generalmentc es- 
tdril que le precedid, la nueva psicologfa expe¬ 
rimental era, en sf misma, un callejdn sin salida, 
al menos en cuanto a pruebas psicoldgicas se 
refierc. El problema cstaba en que los prime¬ 
ros psicdlogosexperimentalcsconfundieron los 
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simples procesos sensoriales con la inteligen- 
:ia. Utilizaron diversos instrumentos de broncc 
para medir umbrales sensoriales y tiempos de 
reaccidn, pcnsando que dichas capacidades eran 
:senciales para la inteligencia. De aquf que en 
acasiones se llame a este periodo la era de los 
Instrumentos de Bronce de las pruebas psico- 
Idgicas. 

A pesar del falso comienzo de los prime- 
rosexperimentalistas, al menos proporcionaron 
jna metodologfa apropiada a la psicologfa. Pio- 
aeros como Wundt, Gallon, Cattell y Wissler 
mostraron que era posible exponer a la mente 
il escrutinio y la medicidn cientfficos. fiste fuc 
an cambio decisivo en las suposiciones axiomi- 
iicas de la psicologfa, un cambio que ha per- 
manecido hasta la actualidad. 

La mayor parte de las fuentes le atribuyen 
i Wilhelm Wundt (1832-1920) la fundacidn del 
primer laboratorio psicoldgico en 1879 en 
Leipzig, Alemania. Es menos sabido que este 
mvestigador llevaba anos midiendo procesos 
mentales, al menos desde 1862, cuando cxpe- 
rimentd con su mcdidor del pensamiento 
[Diamond, 1980). Este instrumentoera un pdn- 
lulo calibrado con agujas que sobresalfan a cada 
lado. El pdndulo oscilaba de un lado a otro, 
golpeando campanas con las agujas. La (area 
lei observador consistfa en lomar nota de la 
posicidn del pdndulo cuando las campanas so- 
riaban. Por supuesto, Wundt podfa ajustar de 
intemano las agujas y, por tanto, conocer la 
posicidn precisa del pdndulo cuando tocaba 
;ada campana. Wundt consideraba que la dife- 
rencia entre la posicidn observada del pdndulo 
y la posicidn real podfa proporcionar un me¬ 
dio para determinar la velocidad de pensamiento 
del observador. 

El an&lisis de Wundt se relacionaba con un 
iftejo problcma en astronomfa, que consistfa en 
que dos o mis astrdnomos que utilizaran de 
mancra simultinea el mismo telescopio (con 
multiples oculares) informanan diferentes tiem¬ 
pos de travesfa, a medida que las estrellas atra- 
vesaban una lfnca de rejilla en el telescopio. 
Incluso en tiempos de Wundt, un acontecimien- 
to muy conocido en la historia de la ciencia era 
que Kf nnebrook, un ayudantc en el Observalo- 


rio Real en Inglaterra, habfa sido despedido en 
1796 debido a que sus tiempos de travesfa es- 
telar estaban demorados en casi un segundo 
(Boring, 1950). El anilisis de Wundt ofrecid 
otra explicacidn que no suponfa la incompe- 
tencia por parte de nadic. Dicho en tdrminos 
sencillos, consideraba que la velocidad de pen¬ 
samiento podfa diferir de una persona a otra: 

Para cada persona debe haber una cietta veloci¬ 
dad de pensamiento, que nunca puedo oxceder 
debido a su constitucldn mental dada. Asi, de la 
misma manera en que una miquina de vapor 
puede ir mis rdpido que otra, es probable que 
esta velocidad de pensamiento no sea la misma 
en todas las personas (Wundt, 1862, segOn la 
traduccldn de Rieber, 1980). 

Este andlisis de los informes de tiempos en te- 
Icscopio parccc simplista segun normas actua- 
les, y pasa por alto la posible contribucidn de 
factores como la atencidn, motivacidn y rctroa- 
limentacidn autocorrectora de los ensayos an- 
teriores. En su lado positivo, dstc fuc al menos 
un anAlisis empfrico que buscaba explicar las 
difcrencias individuates, en vezde tratarde des- 
hacerse de ellas por medio de explicacioncs. Y 
dsa es la relevancia para las priicticas actuales 
en cuanto a pruebas psicoldgicas. A pesar de lo 
rudimentario, Wundt midi6 los procesos men¬ 
tales y reconocid a reganadientes las diferen- 
cias individuates.* 

GALTON Y LA PRIMERA BATERIA 
DE PRUEBAS MENTALES 

Sir Francis Gallon (1822-1911) fue el pionero 
de la nueva psicologfa experimental en la Gran 
Brctana del siglo XIX. Estaba obscsionado con 
la medicidn y su carrera intclcctual parece ha- 
berse visto dominada por la creencia de que 
podfa medirse casi cualquier cosa. Sus intentos 
por medir el intclccto a travds del tiempo de 


* Este dnfais en las diferencias individuates era poco 
comun para WundL £l es mis rcconocido por propo- 
ncr leyes generales del pensamiento para la mente 
adulta promedio. 
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reaccidn y de (areas de discriminacibn senso¬ 
rial son muy conocidos. Sin embargo, para apre- 
ciar sus amplios intereses, cl lector deberfa estar 
entenido de que Galton tambidn discflb tdcnicas 
para medir la belleza, la personalidad, el nivcl 
de aburrimiento de una lectura y la eficacia de 
la oracidn, por nombrar sdlo unas cuantas de las 
empresas que su bibgrafo ha catalogado con 
gran detalle (Pearson, 1914, 1924, 1930ab). 

Galton fue un genio que estaba m.ls intere- 
sado en los problcmas de la evolucibn humana 
que cn la psicologfa en sf (Boring, 1950). Sus dos 
obras con mayor influcncia fueron Hereditary 
Genius (1869), un anilisis empfrico que tenfa cl 
propbsito de probar que los factores gendticos 
son abrumadoramente impoitantcs para cl logro 
de la superioridad, c Inquiries into Human Faculty 
and its Development (1883), una scric desigual 
dc ensayos que enfatizaban las diferencias in¬ 
dividuates en cuanto a facultades mcntales. 

Boring (1950) considera que Inquiries cs 
el comienzo del movimiento de las pruebas 
mentales y del advenimiento de la psicologfa 
cientffica de las diferencias individualcs. El li- 
bro es una curiosa mczcla de investigacibn 
cmpfrica y ensayos especulativos acerca de te¬ 
rms tan diversos como la "diferencia apenas 
perceptible” en el aumento de peso y la dismi- 
nucidn de la fertilidad entre animates que son 
producto de endogamia. Sin embargo, existe un 
tema comun que une a estos ensayos diversos; 
Galton demostr6 una y otra vez que las dife¬ 
rencias individuates no sdlo existen, sino que 
sc pueden medir de manera objetiva. 

Galton tomb prestados los lentos proccdi- 
mientos psicofisicos practicados por Wundt y 
olros investigadorcs cn el continente europeo, 
y los adaptb a una serie de medidas sensorio- 
motoras simples y rbpidas. Asf, continub con 
la tradicidn de los instrumentos de bronce en 
las pruebas mcntales, pero con una important 
diferencia: sus procedimienlos fueron mis ade- 
cuados para la oportuna recoleccidn de datos 
de cientos, si no es que miles, de sujetos. Debido 
a sus csfuerzos para disenar medidas viables 
de las diferencias individuales, en general, los 
historiadores de las pruebas psicoldgicas con- 
sidcran a Galton como cl padre de las pruebas 
mentales (Goodenough, 1949; Boring, 1950). 


Para proseguir con su estudio de las di¬ 
ferencias individuates, Galton establecid un 
laboratorio psicomdtrico cn Londres en la 
International Health Exhibition de 1884. Des¬ 
puds se le transfirib al London Museum, donde 
se mantuvo durante seis ados. Varias medidas 
antropombtricas y psicomdlricas estaban distri- 
buidas cn una larga mesa, a un lado de una es- 
trecha habitacidn. Los participantcs ingresaban 
por un extremo, a tres peniques por entrada, y 
sc les aplicaban pruebas sucesivas a medida que 
pasaban junto a la mesa. Se sometid a prueba 
al menos a 17 000 individuos durante los dece- 
nios de 1880 y 1890. Aproximadamcnte 7 500 de 
los registros de datos individuales han sobrevi- 
vido hasta la actualidad (Johnson, McCleam, 
Yuen, Nagoshi, Ahem y Cole, 1985). 

Las pruebas y medidas implicaban tanto el 
campo ffsico como el conductual. Las caracte- 
rfsticas ffsicas evaluadas eran estatura, peso, 
largo dc la cabcza, ancho de la misma, largo 
del brazo, largo del dedo cordial y del antebrazo, 
entre otras. Las pruebas conductuales inclufan 
fortaleza de la prensidn ejercida con la mano 
determinada con un dinamdmetro; capacidad vi¬ 
tal de los pulmones medida con un espirdmetro, 
agudeza visual; tono mis alto audible; velocidad 
de soplo y tiempo de reaccidn (TR) tanto para 
estfmulos visuales como auditivos. 

En ultima instancia, los intentos simplis- 
tas dc Galton por estimar el intelecto con medi¬ 
das de tiempo de reaccidn y discriminacidn 
sensorial resultaron infructuosos. Sin embargo, 
proporciond un enorme fmpetu al movimiento 
de cvaluacidn al demostrar que podfan diseflarse 
pruebas objeti vas y obtenerse puntuaciones sig- 
nificati vas a travds de procedimientos estanda- 
rizados. 


B cattell importa los 

INSTRUMENTOS DE BRONCE A EUA 

James McKeen Cattell (1860-1944) estudid la 
nueva psicologfa experimental tanto con Wundt 
como con Galton, antes de establecerse en la 
Columbia University, donde, durante 26 anos. 
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fue cl decano indiscutible de la psicologfa esta- 
dounidcnse. Con Wundt realizo una seric dc 
estudios sobre TR claborados de manera con- 
cienzuda (1880-1882). en los quc se midieron 
con gran precisidn las fracciones de segundo 
quc supueslamente se requerfan para las dife- 
rentes reacciones mentales. Tambibn observd, 
casi dc modo incidental, que bl y otro colega te- 
nfan diferencias pequcfias pero consistentes en 
TR. Cattell le propuso a Wundt que dichas di¬ 
ferencias individuates debcnan estudiarsc dc 
manera sistcmdtica. Aunque Wundt reconocid 
las diferencias individuates, estaba mas inclina- 
do filosbficamente hacia el estudio dc las ca- 
racterfsticas generates de la menie y no le prcstd 
apoyo a la propuesta de Cattell (Fanchcr, 1985). 

Pero Cattell recibid ayuda cntusiasta para 
su estudio de las diferencias individuates de 
parte de Gallon, quien apenas habfa inaugura- 
do su laboratorio psicombtrico en Londrcs. 
Despuds de tener correspondencia con Galton 
durante algunos anos, Cattell obtuvo una beca 
dc dos ados en Cambridge, de modo que pudic- 
ra continuar con el estudio de las diferencias 
individuates. Cattell abrid su propio laborato¬ 
rio de investigacidn y dcsarrolld una serie de 
pruebas quc cran principalmente extensiones y 
adiciones a la baterfa de Galton. 

Cattell (1890) invenld cl tdrmino prueba 
mental en su famoso artfculo intitulado " Mental 
Tests and Measurements". Este artfculo descri- 
bfa su programa de investigacidn, dctallando 
10 pruebas mentales que d! proponfa para su 
utilizacibn con cl publico en general. Estas prue¬ 
bas eran con toda claridad reelaboracioncs per- 
feccionadas de la tradicibn de Galton: 

Fortaleza dc la prensibn ejercida con la 
mano, medida con un dinambmetro. 

Tasa de movimiento de la mano a travds de 
una distancia de 50 cm. 

Umbral dc tacto de dos puntos —distancia 
minima en que dos puntos todavfa se 
percibcn como separados. 

Grado de presidn nccesaria para causar do¬ 
lor —presidn de una punta de goma con¬ 
tra la frente. 


Diferenciacibn de peso —discemir los pe¬ 
sos relati vos de cajas de aparicncia idbn- 
tica que variaban en I g desde los 100 
hasta los 110. 

Tiempo de rcaccibn para sonido —utilizan- 
do un instrumento similar al de Gallon. 

Tiempo para nombrar colores. 

Divisibn en dos partes de una Ifnea de 50 cm. 

Juicio de 10 seg de tiempo. 

Numero dc letras repetidas en una audicidn. 

La fortaleza de la prensibn ejercida con la mano 
parcce una adicibn curiosa a una baterfa de prue¬ 
bas mentales, un punto al que Cattell (1890) le 
brindb atencidn directa en su artfculo. Tenfa la 
opinidn dc que era imposible separar la energfa 
corporal de la mental. Asf, desde la pcrspectiva 
de Cattell, una medida ostcnsiblemente fisio- 
Idgica como la prensidn en cl dinamdmetro, 
tambibn era un fndice del propio poder mental. 
Es claro que la predisposicidn fisioldgica y sen¬ 
sorial dc toda la baterfa de pruebas reflcja su 
fuerte herencia galtoniana (Fanchcr, 1985). 

En 1891, Cattell aceptd un pucsto en la 
Columbia University, quc en aquel entonces era 
la universidad mbs grande dc EUA. Su poste¬ 
rior influencia sobre la psicologfa estadouni- 
dense superd en mucho a sus resultados 
cicntfficos individuales y se expresd en gran 
parte a travbs de sus numerosos e influyenles 
alumnos (Boring, 1950). Entre sus muchos y 
famosos cstudiantes de doctorado y los anos en 
quc obtuvicron sus tftulos se cncucntran E. L. 
Thorndike (1898), quien rcalizdcontribuciones 
monumcnlalcs a la tcorfa del aprendizaje y a la 
psicologfa educativa; R. S. Woodworth (1899). 
quien fue el autor del muy popular c influyente 
Experimental Psychology (1938); y E. K. 
Strong (1911), cuyo Vocational Interest Blank 
—revisado desde entonces— todavfa tiene am- 
plio uso. Pero entre los alumnos de Cattell, pro- 
bablemente fue Clark Wisslcr( 1901) quien tuvo 
la mayor influencia en la historia inicial de las 
pruebas psicoldgicas. 

Wissler obtuvo tanto las puntuaciones en 
prueba mental como las calificaciones acadb- 
micas de mbs de 300 estudiantes dc la Columbia 
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University y el Barnard College. Su meta 
consistfa en demostrar que los rcsultados de 
prueba podfan pronosticar el dcscmpefio aca- 
ddmico. Con la pcrspectiva de finales del siglo 
XX acerea dc la investigacidn y las pruebas, 
parece sorprendente quc los primeros experi- 
mentalistas espcraran tanto ticmpo para reali- 
zar dicha investigacidn basica cn cuanto a 
validacidn. Los rcsultados de Wissler (1901) 
mostraron que virtualmcntc no habfa una ten- 
dencia a que las puntuaciones dc una prueba 
mental se correlacionaran con el rendimicnto 
academico. Por cjcmplo, la posicidn dcntro dc 
la clase se correlaciond en .16 con la memoria 
de listas de numeros, -.08 con la fortaleza en el 
dinamdmctro, .02 con el nombrado dc colores 
y -.02 con cl ticmpo de reaccidn. La correla- 
cidn mds alia (.16) fue estadfsticamente signi- 
ficativa debido al gran tamafio de la muestra. 
Sin embargo, una correlacidn tan pequefia I le¬ 
va consigo muy poca utilidad predictiva.* 

Tambien fueron daninas para el movimicn- 
to de pruebas con instrumentos de bronce las 
insuficienlcs correlaciones cntre las pruebas 
mentalcs en sf. Por ejemplo, la indicacidn de 
colores y la vclocidad del movimicnto dc la 
mano se correlacionaron s61o en .19, mientras 
elTR y la indicacidn dc colores se correlaciona¬ 
ron cn -.15. Algo que no produce sorpresa es 
que varias mcdidas ffsicas, como el tamafio dc 
la cabeza (una mcdida que se habfa conserva- 
do desde el tiempo de Gallon), tampoco se 
correlacionaron con diversas mcdidas sensoria- 
les y de TR. 

Con la publicacidn de los desalcntadores 
rcsultados dc Wissler (1901), los psicdlogos 
expcrimentales abandonaron, en tdrminos ge- 


* El coeficienlc dc corrclacidn se analiza con mayor 
dctalle cn el temn 3B, Conccptos de Confiabilidad. 
Pern con el propdsilo dc un avarice rfpido, las correla- 
cioncs pueden ir dc -10 a + 1.0. Los valorcs cercanos 
a 0 indican una rclacidn lineal dlbil, dcspreciablc, 
enlrc las dos vanablcs. Por ejemplo, las corrclacio- 
ncs cntre -.20 y +.20 se considcran, en general, de un 
valor mfnimo para propdsitos de prcdicci6n indivi¬ 
dual. Obsdrvcse tarnbidn quc las correlaciones nega- 
tivas indican relacidn inversa. 


nerales. el uso del TR y de la discriminacidn 
sensorial como inedidas de la intcligcncia. Des¬ 
de un punto de vista, este alcjamicnto del enfo- 
que de los instrumentos de bronce fue una 
cvolucidn dcseable en la historia dc las prue¬ 
bas psicoldgicas. Con cllo se facilitd el caniino 
para la aceptacidn inmediata dc las medidas mds 
sensatas y utiles de Binet para los proccsos 
mcntales superiores. 

Pero en oli os sentidos, el abandono del TR 
y de las medidas scnsoriales fue premature y 
desafortunado. Despuds dc todo, segun normas 
aclualcs, los metodos dc invcstigacidn dc 
Wissler revclaron una inoccncia psicomdlrica 
extraordinaria, Al utilizar como sujetos s6lo a 
alumnos universitarios brillantes, Wissler ha¬ 
bfa introducido de manera inadvertida una res- 
triccidn extrema del rango, quc rcducirfa 
invariablemcntc el tamafio de sus corrclacio- 
nes. Si se hubiera utilizado una muestra mds 
hctcrogdnea dc sujetos, las correlaciones hu- 
bicran s<do sustancialmente mas grandcs. Adc- 
mds, cicrtas mcdidas, como el TR, eran poco 
confiables a nivcl inherente debido al pequeho 
numero de ensayos por sujeto. Tal falta de 
confiabilidad en una medida tarnbidn causa gra¬ 
ves restricciones a los Ifmites superiores de los 
coeficicntcs de corrclacidn. 

Si los hallazgos negativos de Wissler 
(1901) se hubieran analizado con mayor escep- 
ticismo, no hubieran pasado 70 aiios para que 
el TR resuigicra como una medida intclcctual 
potcncialmentc util. Las correlaciones dc -.40 
cntre las formas complcjas dc TR y la inteli- 
gcncia no son poco comuncs cn absoluto 
(Jensen, 1982).' 

Pero eso serfa adelantarse en la historia. La 
reacci6n mds comun cntre los psicdlogos a ini- 
cios del siglo XX fue la de concluir a regafia- 
dientes que Galton habfa estado equivocado en 
sus intentos por inferir capacidades complcjas. 
a partir de capacidades simples. Goodenough 
(1949) ha vinculado el enfoque dc Galton con 


' Las correlaciones son negati vas debido a que las bajns 
puntuaciones cn TR se rclacionan con alias puntua- 
cioncs cn pruebas dc intcligcncia. 
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“inferir la naturalcza del gcnio a partir de la na- 
turaleza de la estupidcz o las cualidades del agua 
a partir de las del hidrdgeno y el oxlgeno de los 
quc se compone". En aparicncia, los psicdlo- 
gos academicos estuvieron de acuerdo con di- 
cha autorn y los intentos estadounidenses por 
desarrollar pruebas de inteligencia cesaron vir- 
tualmcntc a principios de este siglo. Por su par¬ 
te, aparentementc Wissler se desalentd de tal 
modo por sus propios resultados que de in- 
mediato cambio a la antropologla, dondc sc 
convirtid en un fuertc ambientalista cn la cx- 
plicacidn de las diferencias cntrc grupos dtnicos. 

El vacfo creado por el abandono de la tra- 
dicidn de Galton no durd mucho tiempo. En 
Europa, Alfred Binet estaba a punto de lograr 
un gran avance en el examcn de la inteligencia. 
Binet inlrodujo su cscala de inteligencia en 1905 
y poco despuds H. H. Goddard la importd a 
EU A, donde sc aplicd de una mancra que Gould 
(1981) ha descrito como “cl dcsmaniclamicnto 
en EUA de las intenciones de Binet”. La duda 
relativa a si los psicdlogos estadounidenses 
de principios del siglo XX trastocaron las 
intenciones de Binet, constituye una pregun- 
(a importante que sc revisard en cl siguicntc 
tema. Pero primero sc examinardn los cambios 
sociales cn la Europa del siglo XIX que crea- 
ron la neccsidad de pruebas prdclicas de la in¬ 
teligencia. 


■ CAMBIO EN LOS CONCEPTOS 
DE RETRASO MENTAL EN EL 
SIGLO XIX 


Muchos de los grandcs invcntos se han desa- 
rrollado cn respuesta a las necesidades prdcti- 
cas creadas por los cambios en los valorcs 
sociales. Tal es cl cast) de las pruebas de inteli¬ 
gencia. Para scr cspecfficos, Binet desarrolld 
la primcra de dichas pruebas a comienzos del 
siglo XX. para ayudar a identificar a los nifios 
dentro del sistcma escolar de Paris quc no csta- 
ban cn probabilidad de beneficiarse de la edu- 
cacidn habitual. Antes de ese momcnto habla 
poco interns cn las necesidades cducativas de 


los nifios con retraso. Asf, un nucvo humanis- 
mo hacia estos indi viduos cred el problema prfic- 
tico —identificar a aquellas personas con 
necesidades especiales— que las pruebas de 
Binet habrfan de resolver. 

El mundo occidental a finales del siglo XIX 
surgfa apenas de siglos de indiferencia y hosti- 
lidad hacia aquellos que tenlan impedimentos 
psiquidtricos y mcntalcs. Los mddicos empe- 
zaban a rcconocer una distincidn entre perso¬ 
nas con discapacidad emocional y con retraso 
mental. Por siglos, todos estos parias sociales 
reciblan un tratamiento similar. En la edad me¬ 
dia se les “diagnosticaba" en ocasiones como 
brujos y se les quemaba cn la hoguera. Poste- 
riormente, por dpocas se les ignoraba, perse- 
gufa o torturaba. En su amplia historia sobre la 
psicoterapia y el psicoandlisis, Brombeig (1959) 
tienc un capilulo particularmente expllcito so¬ 
bre las diversas formas de maltrato hacia las 
personas con discapacidades mentales y emo- 
cionales, del cual s61o se proporcionora aquf 
un ejemplo. En 1698, un notable mddico escri- 
bi6 un horripilante libro, Flagellum Salulis, en 
el que se abogaba por las golpizas para el trata¬ 
miento de “la melancolla, el frenesl, la pardlisis, 
la epilepsia, la expresidn facial de imbecilidad" 
(Bromberg. 1959). 

A principios del siglo XIX, las mentes mis 
sanas comenzaron a prevalccer. Los mddicos 
se percataron de que algunos de aquellos indi- 
viduos con alteraciones psiquidtricas tenlan 
enfermedades teversibles que no necesariamen- 
te implicaban un intelecto disminuido, micn- 
tras otras personas excepcionales, aqudllos con 
retraso mental, mostraban mayor continuidad 
rclacionada con el dcsarrollo e invariablemen- 
te tenlan deterioro intelectual. Ademds, un hu- 
manismo reciente comenzd a influir en las 
prdcticas sociales hacia los individuos con im¬ 
pedimentos psicoldgicos y mentales, con lo quc 
suigid mayor interds en el diagn6stico y trata¬ 
miento del retraso mental. A1 frente de estos 
desarrollos se encontraban dos mddicos fran- 
ceses, J. E. D. Esquirol y O. E. Sequin, cada 
uno de los cuales revolucion6 el pensamiento 
accrca del retraso mental, lo que ayudd a crcar 
la nccesidad para las pruebas de Binet. 
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esquirol Y EL DIAGNdSnCO 
del retraso mental 

Ccrca de los inicios del siglo XIX, muchos md- 
dicos habi'an comenzado a percibir la diferen- 
cia entre retraso mental (llamado entonces 
idiotez) y enfermedad mental (que con frecucn- 
cia se llamaba demencia). J. E. D. Esquirol 
(1772-1840) fue el primero en establecer por 
escrito la difcrcncia. Su avance diagn6stico 
consistid cn scnalar que el retraso mental era 
un fendmeno del desarrollo que duraba toda la 
vida, mientras la enfermedad mental tenfa por 
lo general un brote mds abrupto en la edad adul- 
ta. Consideraba que el retraso mental era incu¬ 
rable, mientras la enfermedad mental podrfa 
mostrar mejorfa (Esquirol, 1845/1838). 

Esquirol Ic dio gran dnfasis a las habilida- 
des del lenguaje cn cl diagndstico del retraso 
mental. Esto puede ofrccer una explicacidn 
parcial de la razdn por la que las posteriores 
pruebas de Binet y sus dcscendicntcs de tiempos 
modemos brindan un peso tan enorme a las 
capacidades lingUfsticas. Despuds de todo, el 
uso original de las escalas de Binet era, primor- 
dialmente, para identificar a ninos con retraso 
mental que no cstanan en probabilidad de bc- 
neficiarse de la instruccidn escolar habitual. 

Esquirol tambidn propuso el primer siste- 
ma de clasificacidn para cl retraso mental y no 
deberfa causar sorpresa que las habilidadcs del 
lenguaje fueran los principales critcrios diag- 
ndsticos. Kste autor reconocid tres niveles de 
retraso mental: 1) aquellos que utilizan frases 
cortas; 2) los que utilizan sdlo monosflabos y 
3) aquellos que sdlo Horan y no hablan. En apa- 
riencia, Esquirol no reconocid lo que ahora se 
llamana retraso mental leve y en lugar de ello 
proporciond criterios para los cquivalcntes de 
las clasificaciones actuates de retraso mental 
moderado, grave y profundo. 

SEGUIN Y LA E0UCAO6n DE LOS 
INDIV1DUOS CON RETRASO MENTAL 

Quizd mds que ningun otro pionero en el cam- 
po del retraso mental, O. Edouard Seguin 


(1812-1880) ayudd a establecer a finales del 
siglo XIX un nuevo huinanismo hacia las perso¬ 
nas con retraso. Habfa sido alurnno de Esquirol 
y cstudiado con J. M. G. Hard (1774-1838), 
quien cs muy conocido por su intento de entre- 
nar durante cinco ados al nino salvaje de 
Aveyron, un nino montaraz que habfa vivido 
en el bosque durante sus primeros 11 o 12 anos 
(Hard, 1932/1801). 

Seguin pidid prestadas las tdcnicas utiliza- 
das por Hard y dedied su vida a desarrollar pro- 
gramas educativos para las personas con 
retraso. Desde 1838 habfa cstablecido una cla- 
se experimental para individuos con retraso 
mental. Sus csfuerzos de tratamiento le dieron 
reconocimiento international yen un momento 
dado se trasladd a EUA para continuar su tra- 
bajo. En 1866 publied Idiocy, and Its Treatment 
by the Physiological Method , el primer texto 
de importancia acerca del tratamiento del retra¬ 
so mental. Este libro proponfa un enfoque 
sorprendentemente moderno hacia la cducacidn 
de las personas con retraso mental e incluso 
tocaba aspectos de lo que ahora se llamarfa 
modificacion conductual. 

Tales fueron los anteccdentes sociales c 
histdricos que permitieron el florecimicnto de 
las pruebas de intcligencia. Ahora la atcncidn 
se vuelve hacia la invencidn de la prueba mo¬ 
dems de inteligencia por parte de Alfred Binet. 
Se comenzard con un andlisis de las primeras 
influences que moldearon su famosa prueba. 


I INFLUENCE DE LAS PRIMERAS 
INVESTIGACIONES DE BINET 
SOBRE SU PRUEBA 


Como sabe casi cualquier cstudiante de psico- 
logfa, Alfred Binet (1857-1911) inventd la pri¬ 
mers prueba modema de inteligencia en 1905. 
Lo que es menos conocido, pero de igual impor¬ 
tancia para aquellos que pretenden comprendcr 
sus contribuciones a la psicologfa modema, es 
que Binet fue un investigador y autor prolf- 
fico mucho antes de volvcr su alencidn hacia el 
examen de la inteligencia. El cardcter de sus 
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primcras investigaciones tienc injerencia para 
la forma subsccuenic de su muy conocida prue- 
ba de inteligencia. Para quicnes buscan una am- 
plia comprensibn de su esmerada influcncia, cs 
obligatorio hacer una mcncibn breve sobre su 
carrera anterior. Para mayor detalle, el lector 
puede consultar a DuBois (1970), Fanchcr 
(1985), Goodenough (1949), Gould (1981) y 
Wolf (1973). 

Binct comcnzb su carrera en medicina, pero 
se vio forzado a abandonarla dcbido a una cri¬ 
sis emocional generalizada. Cambid a psicolo- 
gfa, donde estudid el umbral de dos puntos y 
mostrd un ligero intcrds en la psicologfa 
asociacionista de John Stuart Mill (1806-1873). 
Despuds selecciond trabajar como aprendiz con 
el neurdlogo J. M. Charcot (1825-1893) en el 
famoso Salpetriere Hospital. Asf, durante un 
breve periodo, la ruta profesional de Binct fue 
paralela a la de Sigmund Freud, quicn tam- 
bidn estudid la histcria bajo la supcrvisidn de 
Charcot. En cl Salpetriere Hospital , Binet fue 
coautor (junto con C. Fere) de cuatro estudios 
que supucstamenle demostraban que la inver- 
sidn de la polaridad de un imdn podia inducir 
completos cambios cn el cstado de ammo (de 
fclicidad a tristeza) o transferir una pardlisis 
histdrica (p. ej.. del lado izquierdo al derecho) 
en un mismo individuo bajo hipnosis. En rcs- 
puesta a la crftica publica de otros psicdlogos, 
Binct publicd dcspuds una rcctificacidn de sus 
descubrimientos. fete fue un doloroso cpiso- 
dio para Binet, to cual desvid su carrera de 
manera temporal. Sit embargo, aprendio dos 
cosas a travds de su vergUenza. Primero, nun- 
ca utilizd de nuevo procedimientos experimen- 
talcs descuidados que dicran lugar a que las 
sugercncias no intcncionales influyeran sobre 
sus rcsultados. Scgundo, se volvid escdptico 
acerca del Zeitgeist (espintu de los liempos) cn 
la psicologfa experimental. Aplicd ambas lec- 
ciones cuando postcriormcnte desarrolld sus es- 
calas de inteligencia. 

En 1891, Binct fue a trabajar a la Sorbona 
como asistente, sin remuneracion, y comcnzd 
una serie de estudios y publicaciones que ha- 
brian de definir su nueva “psicologfa individual" 
y que culminarfan en ultima instancia en sus 


pruebas de inteligencia. Binct era un experimen- 
talista ferviente, que con frecuencia utilizaba a 
sus dos hijas para examinar sus pruebas de in¬ 
teligencia exisicntcs o nuevas. Al principio tuvo 
un acercamiento al enfoque de Cattell sobre el 
examen de la inteligencia. utilizando con sus 
dos hijas las medidas estandar de tiempo de re- 
accidn y agudeza sensorial. Los rcsultados fue- 
ron inedmodamente inconsistentes y diffeiles 
de interpretar. Como podrfa esperarse, encon- 
trd que los tiempos de rcacci6n de sus hijas 
cran, en promedio, mucho mbs lentos que 
para los adultos. A partir de estos descubri- 
micntos, Binet concluyd que la atcncidn era 
un componente clave de la inteligencia, que 
era cn sf misma una entidad sumamente multi- 
facdtica. Lo que cs mas, se fue decepcionando 
del enfoque de los instrumentos de bronce para 
la medicidn de la inteligencia, lo cual es proba¬ 
ble que explique su utilizacidn subsecuente de 
medidas de los proccsos mcntales superiores. 

Adcmds, los experimentos sensopercep- 
tuales de Binet con sus hijas influyeron en gran 
medida sobre sus pcrspectivas acerca de los 
procedimientos adecuados de prueba: 

El experimentador esta obllgado, hasta cierto 
punto, a adaptar su mbtodo al sujeto a quien se 
dinge. Se deben segulr ciortas reglas cuando uno 
experiments con un nifio, de la misma manera 
que existen ciertas reglas para los adultos. las 
personas con histeria y los enlermos mentales. 
Estas reglas no estdn escritas en ningun lado: 
cada quien las aprende por si solo y se ve remu- 
nerado en gran medida. Al cometer un error y 
despuds explicar su causa, se aprende a no co¬ 
meter el error en una segunda ocasibn. Con res- 
pecto a los nifios, es necesario sospechar de dos 
causas principalss de error: la sugesltdn y las 
(alias de atencion. Este no es el momenta de 
habiar del primer punto. En cuanto al segundo, 
las (alias de atencidn son tan Importantes que 
siempre es necesario sospechar de ellas cuan¬ 
do se obliene un resultado negative. En ese mo¬ 
menta se deben suspender los experimentos y 
retomarlos en una ocasibn mbs favorable, repl- 
tlbndolos 10, 20 veces, con enorme paciencia. 

De hecho, es (recuente que los nifios estbn pooo 
dispuestos a prestarle atencion a los experimen- 
los que no son entretenidos. y es inutil espe- 
rar que se los pueda hacer que presten mayor 
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atencidn amenazandolos con un castigo. Sin 
embargo, con estxatagemas particutares, en oca- 
siones so puede dar un clerlo atractivo a! expe- 
rimento (Binet, 1895, citado en Pollack. 1971). 

Es interesante comparar las prdcticas actuales 
dc prueba —que llegan al grado dc cspccificar 
el fraseo cxacto que dcbe utilizer el examina- 
dor— con cl consejo de Binei acerea de ejerci- 
tar una paciencia casi interminable y utilizar 
trucos entretenidos cuando sc somctc a prueba 
a los ninos. 


BINET Y EL EXAMEN DE LOS 
PROCESOS MENTALES SUPERIORES 

En 1896, Binet y su ayudante en la Sorbona, 
Victor Henri, publicaron una revisidn funda¬ 
mental de los trabajos alemancs y cstadouni- 
denses sobre diferencias individualcs. En cstc 
arti'culo, que posee gran importancia histdrica, 
discuticron que la inteligencia podia medirse 
mejor a traves de los proccsos psicoldgicos su- 
periores que con procesos sensoriales clcmcn- 
tales, como el tiempo de reaccidn. Despuds dc 
varios inicios en falso, Binet y Simon llegaron 
en un momento dado al scncillo formato de sus 
escalas de 1905, que sc analizan mds adelante. 

El cardcter de la escala de 1905 Ic dcbe 
mucho a una prueba anterior claborada por el 
Dr. Blin (1902) y a su alumno M. Damaye. Es- 
tos investigadores habfan intentado mejorar cl 
diagndstico del retraso mental a travds del uso 
de una baterfa dc evaluacidn en 20 dreas como 
lenguaje hablado, conocimicnto dc las partes 
del cucrpo, obediencia a 6rdenes simples; 
nombrado de objetos comuncs y capacidad para 
leer, cscribir y hacer cdlculos aritmdticos sen- 
cillos. Binet criticd la escala por considcrarla 
demasiado subjetiva, por tener reacti vos que rc- 
flcjaban la educacidn formal y por utilizar un 
formato dc sf o no en muchas preguntas (DuBois, 
1970). Pero se mostrd sumamente impresio- 
nado por la idea de utilizar una baterfa de prue¬ 
bas, una caraclerfstica que adoptd en sus escalas 
de 1905. 


En 1904, el ministro de Educacidn Publica 
en Paris (Minister of Public Instruction) esta- 
blecid una comisi6n para decidir sobre las me- 
didas cducativas que deberfan emprenderse con 
aquellos ninos que no podfan bcncficiarsc dc 
la educacidn regular. La comisidn concluyd que 
deberfan utilizarse exdmenes medicos y educa- 
livos para identificar a aquellos ninos que no 
podfan aprender a iraves de metodos regulates. 
Lo que es mds, se determind que se deberfa re- 
lirar a estos nifios de las clascs regulares y dar- 
les instruccidn especial, adecuada a su habilidad 
intclcctual mds limitada. Este fue el principio 
dc las clascs dc educacidn especial. 

Era evidente la ncccsidad dc un medio para 
seleccionar a los ninos para tal asignacidn es¬ 
pecial y se le solicitd a Binet y a su colaborador 
Simon que dcsarrollaran una herramienta prdc- 
tica dirigida unicumcnte a dicho propdsito. Asf 
surgid la primera escala formal para evaluar la 
inteligencia de los nifios. 

Goodenough (1949) ha resumido las cua- 
tro maneras en que la escala de 1905 diferfa 
con respccto a aqudllas construidas antes. 

1. No afirmaba medir precisamcntc ninguna 
facultad en particular. Mds bien, se dirigfa 
a evaluar el dcsarrollo mental general del 
nifio con un grupo helerogdneo de tareas. 
Asf, la meta no era la medicidn, sino la cla- 
sificacidn. 

2. Era una prueba breve y prdctica.Toma- 
ba menos de una hora para su aplicacidn 
y requerfa pocos elementos en cuanto a 
equipo. 

3. Media de manera directa lo que Binet 
y Simon considcraban como el factor esencial 
de la inteligencia —el juicio prdctico— en 
lugar de perder el tiempo con capacidades 
de menor nivel que implicaran elementos 
sensoriales, motores o perceptuales. Asu- 
mfan una perspecliva practica de la inteli¬ 
gencia. 

Nos parece que en la Inteligencia exisle un ele- 
mento fundamental, cuya falla o alteracion 
liene la mayor importancia para la vida prdctica; 
este es el juicio, conocido tarnbien como sentido 
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cormin. sentido practico, iniciath/a o facultad para 
adaplarse. Juzgar bion, compronder bien y ra- 
zonar bien son ios manantiales de la inteligencia 
(Blnet y Simon, 1905; segun la traduccldn en 
Fancher, 1985). 

4. Los reactivos estaban distribuidos segun 
su nivel aproximado de dificultad, en vez 
de en funcidn del contenido. Se realizd una 
estandarizacidn preliminar con SO nihos 
normales cuyas edades iban de 3 a 11 ahos 
y tambidn con varios niiios subnormalcs y 
con retraso. 

Las 30 pruebas en la escala de 190S iban de las 
pruebas sensorialcs abicrtamcntc simples, a 
las abstraccioncs vcrbalcs bastantc complcjas. 
Asf, la escala era apropiada para evaluar la gama 
completa de la inteligencia —desde el retraso 
mental grave hasta Ios niveles superiores de la 
inteligencia dotada. La escala completa se re¬ 
sume en el cuadro 1-1. 

Excepto por las pruebas muy sencillas que 
se diseiiaron para la clasificacidn de Ios idio- 
tas de grado muy inferior (un tdrmino diagnds- 
tico muy desafortunado que se ha abandonado 
desde entonces), las pruebas teni'an importan- 
tes cargas hacia las habilidades vcrbalcs, lo cual 
rcfleja el alejamicnto de Binet con rcspecto a 
la tradicidn de Galton. 

Un punto interesante que con frecuencia 
pasan por alto Ios alumnos de psicologfa en la 
actualidad, cs que Binet y Simon no ofrecieron 
en su escala de 190S un mdtodo preciso para 
llegar a una puntuacidn total. Seria bueno rc- 
cordar que su propdsito era la clasificacidn, no 
la medicidn, y que su motivacidn era complc- 
tamentc humanitaria, es decir, la de identificar 
a aqucllos niiios que necesitaban asignarse a 
educacidn especial. Segun normas contcmpo- 
rdneas, es dificil accptar la confusidn inherente 
a dicho enfoque, pero ello puede reflejar una 
inclinacidn moderna hacia la cuantificacidn mris 
que una debilidad por parte de la escalade 1903. 
De hecho, su escala fue popular entre los 
educadores en Paris. Incluso en ausencia de 
una cuantificacidn prccisa, cl enfoque fue cxi- 
toso en la selcccion de candidatos para clases 
especiales. 


S LAS ESCALAS REVISADAS 
Y EL AOVENIMIENTO DEL a 


En 1908, Binet y Simon publicaron una revi- 
si6n de la escala de 1903. En la escala anterior, 
mds de la mitad de los reactivos habfan sido 
disenados para los individuos con retraso muy 
notable; sin embargo, las principales decisio- 
nes diagn6sticas implicaban a niiios mayores y 
a personas con un intclecto limftrofe. Para re- 
mediar estc desequilibrio, se abandond la ma¬ 
yor parte de los reactivos muy simples y se 
ahadieron nuevos al extremo superior de la cs- 
cala. La escala de 1908 tenia 38 problemas o 
pruebas, casi el doble del niimero de 1903. Se 
ahadieron nuevas pruebas, muchas de las cua- 
les todavla se ulilizan hoy dia: reconstruccidn 
de oracioncs en desorden, copiado de un rom- 
bo y realizacidn de una sccuencia de tres 6rde- 
nes. Algunos de los reactivos consistian en 
absurdos que los nihos tenian que detectar y 
explicar. Uno de dichos reactivos era divertido 
para los nihos franceses: “Se halld cl cuerpo de 
una desafortunada niha, cortado en 18 trozos. 
Se piensa que la niha se suicid6". Sin embargo, 
este rcactivo era muy perturbador para algunos 
individuos estadounidenses, lo cual demuestra 
la importancia de los factorcs cullurales en la 
inteligencia (Fancher, 1985). 

La principal innovacidn de la escala de 
1908 era la introduccidn del conccpto de nivel 
mental. Las pruebas sc habfan cstandarizado 
con cerca de 300 nihos normales entre 3 y 13 
ahos de edad. Esto permitid que Binet y Simon 
ordenaran las pruebas segun el nivel de edad 
en el que por lo comtin se aprobaban. Cuales- 
quiera reactivos que aprobaran de 80 a 90% de 
los nihos de tres ahos, se asignaba al nivel 
de tres ahos y asf succsivamentc, hasta los 13 
ahos. Binet y Simon tambidn diseharon un sis- 
tema aproximado de calificacidn dondc se dc- 
terminaba primero una edad basal a partir del 
nivel de edad en que no se fallaba cn mds de 
una prueba. Por cada cinco pruebas aprobadas 
a niveles por arriba del nivel basal, sc concedfa 
un aho completo de nivel mental. En la medida 
en que no se daba credito por ahos parciales de 
nivel mental y los diversos niveles de edad 
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Cuadro 1-1. Escala Binet-Simon de 1905 

1. Sigue con los ojos un objelo en movimiento. 

2. Toma un pequeno objelo cuando se lo loca. 

3. Toma un pequeno objelo cuando se lo ve. 

4. Reconoce la diferenda enlre un cuadro de chocolate y uno de madera. 

5. Encuenlra e ingiere un cuadro do chocolate envuelto en papel. 

6. Obedece ordenes sencillas e imita ademanes simples. 

7. Sefiala objetos lamiliares nombrados; por ejemplo: "Muestrame la laza" 

8. Sefiala objetos representados en Idminas; por ejemplo: “Coloca tu dedo en la venlana". 

9. Nombra objetos representados en dibujos; por ejemplo: “iQud es esto?" [el examinador sefiala 
un dibujo de un slgno). 

10. Compare dos lineas de longitud notablemente deslgual. 

11. Replte tres dfgitos hablados. 

12. Compare dos pesos. 

13. Muestra susceptibilidad a la sugeslidn. 

14. Define palabras comunes segun su luncidn. 

15. Repile una oracidn de 15 palabras. 

16. Explica la diferenda entre dos objetos comunes; por ejemplo: “papel y cartdn" 

17. De un total de 13 objetos presentados en un tablero, mendona de memoria el mayor niimero 
posible en un lapso de 30 seg. [Esta prueba se abandond despuds debido a que propiciaba 
demasiadas posibilidades de distracddn.] 

18. Reproduce de memoria dos disenos mostrados durante 10 seg. 

19. Repite una serie mds larga de dfgitos que en el punto 11 para someter a prueba la memoria inmediata. 

20. Dice en qud se parecen dos objetos; por ejemplo: “mariposa y pulga". 

21. Compare dos Ifneas de longitud un tanto desigual. 

22. Compare cinco cubos para ordenarlos por peso. 

23. Indica cudl de los cinco pesos anteriores ha retirado el examinador. 

24. Rima palabras; por ejemplo: “iQud rima con 'escuela'?" 

25. Una prueba de palabras incompletas basada en aquellas propuestas por Ebbinghaus. 

26. Coloca tres sustanlivos; por ejemplo: “Paris, rfo, fortuna" (o tres verbos) dentro de una oracidn. 

27. Responde a 25 preguntas abstractas (comprensidn); por ejemplo: "Cuando una persona te ha 
ofendido y viene a ofrecer disculpas, ^que deberfas hacer?" 

28. Inviede las manecillas de un reloj. 

29. Despuds de doblar y cortar papel, dibuja la forma de los orificios resultantes. 

30. Define palabras abstractas estableciendo la diferenda entre ellas; por ejemplo: “hastfo y cansancio". 

Fuente: Basado en las Iraducdortes quo aparecen on Jenkins y Paterson (1961) y Jensen (1980) 


tenian desde 3 hasta 8 pruebas, el mdtodo deja- 
ba mucho que desear. 

En 1911 aparccid una tercera revisidn de las 
escalas Binet-Simon. Ahora, cada nivel de edad 
tenfa exactamentc cinco pmebas. La escala tam- 
bidn se extendid hasta el rango adulto. Y, con 


cierta renuencia, Binet introdujo nuevos mdto- 
dos de calificacidn que conccdfan una quinta 
parte de un aflo por cada subprueba aprobada 
porencima del nivel basal. En sus escritos, Binet 
enfatizd en gran medida que no deberfa tomar- 
sc demasiado en serio el nivel mental exacto 
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del nifio como unu medida absoluta de la inteli- 
gencia. 

Sin embargo, la idea de obtener un nivcl 
mental fue un desarrollo monumental que ha- 
brfa de influir el cardcter dc las pruebas de in- 
tcligencia a lo largo del siglo XX. Despuds de 
unos cuantos meses, lo que Binct llamd nivcl 
mental se traduefa como edad mental. Y los 
cxaminadores en todas partes, incluyendo Binet 
mismo, comparaban la edad mental de un nifio 
con su edad cronoldgica. Asf, un nifio dc nue- 
ve afios que funcionaba al nivcl mental (oedad 
mental) de un nifio de seis afios, tenfa un rctra- 
so de ires afios. Muy poco liempo despuds. Stem 
(1912) sefiald que un retraso de tres afios tenfa 
diferentes significados. dependiendo dc la edad. 
Un nifio de cinco afios que funeiona a un nivel 
de dos afios de edad tienc una alteracidn mayor 
que uno dc 13 afios que funeiona a un nivel dc 
10 afios. Stern sugirid que un cocicnte de inte- 
ligencia calculado a partir dc la division de la 
edad mental entre la edad cronoldgica darfa una 

RESUMEN 

1. Para bien o para mat. los resultados de una 
prueba psicoldgica tienen cl poder de alte- 
rar vidas. Una revisidn de las tendencias his- 
l6ricas cs crucial si se desea comprender la 
influcncia contempordnca de las pruebas 
psicoldgicas. 

2. Las formas rudimentarias de las pruebas da- 
tan del afio 2200 a.C. cn China. Los empe- 
radores chinos utilizaban extenuantes 
examenes por cscrito para scleccionar a los 
funcionarios publicos. 

3. Desde mediados hasta finales del siglo XIX, 
varios mddicos y psiquialras desarrollaron 
procedi mientos estandarizados para revclar 
la naturaleza y grado dc los sfntomas en per¬ 
sonas con enfermedad mental y lesion ce¬ 
rebral. Por ejemplo, en 1885, Hubert von 
Grashey desarrolld el precursor del cilin- 
dro mnemdnico para someter a prueba la 
habilidad de reconocimiento visual de pa- 
cientes con lesidn cerebral. 


mejor medida del funcionamiento relativo de una 
persona en comparacion con individuos de su 
misma edad. 

En 1916, Tcrman y sus colaboradorcs cn 
Stanford revisaron las escalas Binet-Simon y 
produjeron la Stanford-Binct, una exitosa prue¬ 
ba que se analizarii en un capftulo posterior. 
Terman sugirid multiplicar el Cocicnte de Inte- 
ligencia por 100 para eliminar las fraccioncs; 
tambidn fue la primera persona cn utilizar la 
abreviatura Cl. Asf nacid uno de los conceptos 
mds popularcs y poldmicos de la hisloria de la 
psicotogfa. Binet murid en 1911, antes dc que 
cl Cl sc gcncralizara en las pruebas cstadouni- 
denscs. de modo que nunca se sabrd lo que habrfa 
pensado de este nuevo desarrollo basado en sus 
escalas. Sin embargo, su colaborador Simon afir- 
md poslcriormente que el concepto de Cl era 
una “traicidn" a los objetivos onginales de su es- 
cala (Fancher, 1985, p. 104) y se puede supo- 
ner, con base en las prcocupaciones humanistas 
dc Binet, que habrfa tenido una opinidn similar. 


4. Las pruebas psicoldgicas modernas le de- 
ben su comienzo a la era de los instru- 
mentos de bronce en psicologfa que florecid 
en Europa durante finales del siglo XIX. 
Mediante el examcn de los umbrales sen- 
soriales y tiempos dc reaccidn, los pione- 
ros en el desarrollo de pruebas, como Sir 
Francis Gallon, demostraron que era posi- 
ble medir la mente de mancra objetiva y 
replicable. 

5. Wilhelm Wundt fundd el primer laboratorio 
psicoldgico en Leipzig, Alcmania, en 1879. 
Incluida entre sus primeras investigaciones 
se encucntra su intento. realizado en 1862, 
dc medir la velocidad de pensamiento con 
un medidor del pensamiento, un pdndulo 
calibrado con agujas que sobresalfan a cada 
lado. 

6. La primera referenda a las pruebas menta- 
les aparecid en 1890 en un artfculo cldsico 
de James McKeen Cattell, un psicdlogo 
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estadounidense que habfa estudiado con 
Gallon. Cattcll importd a EUA cl enfoque 
dc los instrumentos dc bronce. 

7. Uno de los alumnus de Cattell, Clark Wissler, 
mostr6 que las mcdidas de ticmpo de reac- 
cidn y de discriminacidn sensorial no se 
corrclacionaban con las calificaciones uni- 
vcrsitarias, con lo cual se rcdirigid al movi- 
mientode las pruebas mentalcs en direccidn 
opuesla a los instrumentos de bronce. 

8. A finales del siglo XIX, un humanismo re- 
ciente hacia los individuos con retraso men¬ 
tal, reflejado en el trabajo diagndstico y 
terapcutico de los mddicos franceses Esqui- 
rol y Scguin, ayudd a crear la necesidad dc 
las primcras pruebas de inteligencia. 

9. Alfred Binet, quien habrfa de inventar la pri- 
mera prueba verdadera de la inteligencia, 
comenzd su carrcra estudiando la pardlisis 
histdrica con el neurdlogo francds Charcot. 
La afirmacidn de Binet de que el magnetis- 
mo podfa curar la histeria fue refutada, para 
su vergUenza. Poco despuds cambid de in- 


tereses y llevd a cabo estudios scnsoper- 
ccptualcs con ayuda dc sus hijos. 

10. En 1905, Binet y Simon elaboraron la pri- 
mera prueba ritil dc inteligencia en Paris, 
Francia. Su sencilla medida de 30 reactivos 
dirigida a las funciones mentalcs superio- 
res ayudd a identificar a los escolares que 
no se podfan bcneficiar de la educacidn re¬ 
gular. Curiosamente, no habfa un mdtodo 
para calificar la prueba. 

11. En 1908, Binet y Simon publicaron una es- 
cala revisada con 58 reactivos, la cual in- 
corporaba el concepto de nivel mental. En 
1911 aparecid una terccra revisidn de las 
escalas Binel-Simon. Ahora, cada nivel de 
edad contenfa cxactamente cinco pruebas; 
la eseala se extendid hasta el rango adulto. 

12. En 1912, Stern propuso dividir la edad 
mental entre la edad cronoldgica para ob- 
tener un Cociente de Inteligencia. En 1916, 
Terman sugirid multiplicarlo por 100 
para eliminar las fracciones. Asf nacid el 
concepto de Cl. 
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Resum en 


Las cscalas Binet-Simon ayudaron a re¬ 
solver un dilcma social prbctico; a saber, cbmo 
identificar a los nirios que necesitaban cduca- 
cibn especial. Con esta exitosa aplicacibn de 
una prueba mental, los psicblogos se percata- 
ron de que sus inventos podfan tener impor- 
tancia prbctica para diferentes scctores de la 
sociedad. Casi de inmediato, los psicblogos en 
EUA adoptaron una pcrspcctiva utilitaria. 
Muchos vieron en las pruebas de inteligcncia 
una respuesta confiable y objetiva a los proble- 
mas sociales percibidos, como la identificacibn 
de los inmigrantes con retraso mental y la cla- 


sificacibn rapida y precisa de los reclutas del 
ejbrcito. 

La cucstibn sobre si estas primeras pruebas 
resol vieron en realidad los problemas sociales —o 
tan sblo los exacerbaron— es un problema muy 
controvertido que se trata mbs add ante. Algo que 
sf es seguro es que la profusibn de pruebas elabo- 
radas a principios de cstc siglo ayudb a moldcar el 
carbcter de las contemporbncas. Una rcvisibn de 
estas tendencias histbricas ayudarb a comprender 
la naturaleza de las pruebas modemas y a un me- 
jor reconocimiento de los aspectos sociales que 
dichas pruebas han hecho surgir. 
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■ PRIMEROS USOS Y ABUSOS 
DE LAS PRUEBAS EN EUA 


PRIMERA TRADUCCI6N DE LA ESCALA 
BINET-SIMON 

En 1906, Henry H. Goddard fue contratado por 
la Vineland Training School , en Nueva Jersey, 
para investigar la clasificaci6n y educacidn 
de ninos “ddbilcs mentales”. Pronto sc percat6 de 
que se rcquerirfa un instrumento diagndstico y, 
por tanto, se sinti6 complacido de leer accrca 
de laescala Binct-Simon de 1908. Rdpidamente 
se dio a la tarea de traducir la escala haciendo 
cambios de imporlancia menor, de modo que 
pudiera aplicarsc a los ninos estadounidcnscs 
(Goddard, 1910a). 

Goddard (1910b) examind a 378 residen- 
tcs del cenlro Vineland y los clasiftcd con base 
en el diagndstico y la edad mental. Clasificd a 
73 residentes como idiotas debido a que su edad 
mental era de dos aiios o mcnos; a 205 se les 
denomind imbeciles, con edades mentales de 3 
a 7 aiios; y a 100 como ddblles mentales, con 
edades mentales de 8 a 12 ados. Es util sefialar 
que los tdrminos originalmente neutros y des- 
criptivos para dcnominar los niveles de retraso 
mental —idiota, imbdcil y ddbil mental— han 
ingresado al Idxico cotidiano como palabras 
peyorativas. De hecho, Goddard hizo su propia 
contribucidn al acuiiar el tdrmino diagndstico 
moron (del griego moronia, que significa “ne- 
cio"). 

Goddard (1911) tambidn sometid a 1 547 
niflos normales a las pruebas traducidas de las 
escalas Binct-Simon. Considerd que los ninos 
cuya edad mental se encontraba cuatro o mds 
ados por dcbajo de su edad cronoldgica eran 
ddbiles mentales —dstos constituycron 3% de 
su muestra. Si se estima que todos estos nidos 
sc encontraban fuera de las instituciones para 
individuos con retraso, 3% es una tasa alarmante 
de “deftciencia mental”. Goddard (1911) tenfa 
la opinidn de que se deberfa segrcgar a estos 
nidos para evitar que “contaminaran a la socie- 
dad”. Estos primeros estudios azuzaron la cu- 
riosidad de Goddard acerca de los ciudadanos 


“debiles mentales" y sobre las cargas sociales 
que dstos imponfan. Tambidn se gan6 la rcpu- 
tacidn de uno de los principales expertos en el 
uso de pruebas de inteligencia para identificar 
a personas con discapacidadcs intelectuales. Sus 
talcntos pronto tuvieron una fuerte demanda. 

LA BINET-SIMON Y LA INMIGRAa6N 

En 1910, el comisionado de inmigracidn invitd 
a Goddard a la isla Ellis para que le ayudara a 
realizar un examen mds preciso de los inmi- 
grantes. A principios del siglo XX habfan em- 
pezado a correr una seric de mitos oscuros y 
premonitorios acerca del retraso mental y la 
inmigracidn: 

Se creia que los ddbiles mentales eran seres 
degenerados responsables de muchos, si no es 
que de todos, los problemas sociales; se repro- 
ducian a una tasa alarmante y amenazaban la 
aptitud bioldgica general de la nacidn. y su nu- 
mero se incrementaba debido a la llegada de 
"nuevos" inmigranles Indeseables provenientes 
de palses del sur y este de Europa, que habfan 
estado suptantando a los 'Viejos" Inmigranles de 
las areas node y oeste de Europa (Gelb, 1986). 

Al principio, a Goddard no le preocupaba la 
supucsta amenaza de la debilidad mental que 
reprcscntaban los inmigrantes. Escribi6 sobre 
la incxistencia de datos estadfsticos adecuados 
y que las opiniones gcnerales acerca de los gran- 
des porcentajcs de inmigrantes con defectos 
mentales eran “una sobrestimacidn exagerada" 
(Goddard. 1912). Sin embargo, a partir de visi- 
tas repetidas a la isla Ellis lleg6 a convencerse 
de que las tasas de debilidad mental eran mu- 
cho mds altas que las estimadas por los medi¬ 
cos del personal del servicio de inmigracidn. 
Dentro de ese mismo afio revirtid por completo 
sus opiniones y solicitd fondos al Congreso para 
contratar a expertos entrenados en el uso de 
pruebas de inteligencia para formar parte del 
personal de la isla Ellis. En el siguientc dece- 
nio, Goddard se volvid un apdstol del uso de 
las pruebas de inteligencia para identificar a los 
inmigranles con debilidad mental. Aunque es- 
cribid que las tasas dc inmigrantes con ese 
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problema cran “alarmantes", no se adhirii a la 
peliciin popular dc restringir la inmigraciin 
(Gelb, 1986). 

Con frecuencia, la historia de Goddard y 
su preocupaciin por “la amenaza de la debili- 
dad mental”, como lo ha expresado satfrica- 
mente Gould (1981), se ha ignorado o se Ic ha 
restado importancia en los libros sobre pruebas 
psicoligicas. La mayor parte de los textos so¬ 
bre pruebas no se refieren o mencionan a 
Goddard cn absoluto. Los pocos libros que ha- 
blan de 61 exprcsan cn general quc Goddard: 

. . utilizi las pruebas en instituciones para 
individuos con retraso..lo cual es con toda 
seguridad una subeslimaciin. En su influ- 
yente libro History of Psychological Testing , 
DuBois (1970) liene una fotograffa de Goddard, 
pero le dedica menos de una lfnea dentro del 
texto. 

El hecho es que Goddard fue uno de los 
psicilogos estadounidenses con mayor influen- 
cia a principios del siglo XX. Por tanto, cual- 
quier persona cuidadosa debe preguntarse por 
qui (antos autores contcmporaneos han igno¬ 
rado o desprcciado a quien fue el primero en 
traducir y aplicar las pruebas de Binet en EUA. 
Aquf se intentari responder esta pregunta, con 
base, en parte, en los escritos originates dc 
Goddard, pero tambiin en funciin de la crftica 
de Gould (1981) acerca de los voluminosos tex¬ 
tos de Goddard sobre retraso mental y pruebas 
de inteligencia. Tambiin se hacc referenda al 
retrato mis compasivo de Goddard quc nos pro- 
porciona Gelb (1986). 

Quizi Goddard ha sido ignorado cn los 
libros de texto debido a que era un cstricto cre- 
yente en la herencia, la cual concebfa a la inte¬ 
ligencia cn tirminos mendelianos simples. Sin 
duda, su peliciin de establecer una colonia de 
“morones”, de modo que se restringiera su re¬ 
produced, le ha ganado tambiin la desapro- 
baci6n contemporinea. Y su insistencia en que 
conductas indcscables como criminalidad, al- 
coholismo y prostituciin eran el producto del 
retraso mental hcreditario, tampoco se ajusta 
con la postura ambientalista modema. 

No obstante, la razdn mis probable por la 
que los autores modernos han ignorado a 


Goddard, es que ejemplificaba a gran numero 
de los primeros psicilogos mis destacados que 
participaron en cl obvio uso incorrccto de las 
pruebas de inteligencia. En sus esfuerzos por 
demostrar que cada dfa ingresaban a EUA gran 
numero de inmigrantes con retraso, Goddard 
envi6 a sus ayudantes a la isla Ellis para aplicar 
su traducciin inglesa de las pruebas Binet- 
Simon a inmigrantes reciin llegados. Las prue¬ 
bas se aplicaban a (raves de un traductor, poco 
despuis de que las personas habfan arribado. 
Se puede suponer que muchos de ellos se en- 
contraban atemorizados, confundidos y desorien- 
tados; por tanto, una prueba disenada en fran¬ 
cos y traducida luego al inglis, se retraduefa 
posteriormente al yiddish, hungaro, italiano o 
ruso; se le aplicaba a granjeros y obreros con¬ 
fundidos que haefa poco habfan soportado una 
(ravesfa por cl Atlintico y se le interpretaba 
segun las normas originates francesas. 

iQui encontri Goddard y cuiles fueron sus 
conclusiones acerca de los resultados? En pe- 
quehas muestras de inmigrantes (22 a SO), sus 
ayudantes encontraron que 83% de los judfos, 
80% de los hungaros, 79% dc los italianos y 
87% de los rusos eran dibiles mentales; es de- 
cir, sc encontraban por debajo de los 12 afios 
de edad en las escalas Binet-Simon (Goddard, 
1917). Su interpretaciin de estos datos es. se¬ 
gun el caso, de un escepticismo cauto y des¬ 
puis de un alarmismo provocativo. En una parte 
del informe afirma que su estudio "no hace nin- 
guna dctcrminaciin acerca del porcentaje real, 
incluso dentro de estos grupos, en cuanto a di¬ 
biles mentales". Sin embargo, despuis expresa 
que sus cifras silo necesitan revision en cuan¬ 
to a “una cantidad relati vamente pequena”, con 
el fin de encontrar los porcentajes reales de di¬ 
biles mentales entre los grupos de inmigrantes. 
Lo que es mis, concluye que la inteligencia del 
inmigrante promedio es baja, “quizd a nivel de 
morin", pero despuis cita la privaci6n ambien- 
tal como cl principal culpable. De modo simul- 
tineo, Goddard parece favorecer la deportaci6n 
para los inmigrantes con un Cl bajo, pero tam- 
biin expresa la pcrspectiva humanitaria dc que 
se podria utilizar a “trabajadores morones” si 
silo “somos suftcientemcntc sabios como para 
entrcnarlos de mancra apropiada”. 
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Existe mucho mis con respecto a la era de 
Goddard de las primeras pruebas de inteli- 
gcncia y se alicnta al lector interesado a con- 
sultar a Gould (1981) y Gelb (1986). El punto 
mis importante que se quiere destacar en este 
caso cs que —como muchos de los primeros 
psicdiogos— las perspectivas acaddmicas de 
Goddard estuvieron bajo la influencia de las 
ideologias sociales de su tiempo. Por ultimo, 
Goddard fue un erudito complejo que refind y 
contradijo sus opiniones profcsionalcs en nu- 
merosas ocasiones. Un ejemplo irdnico de ello 
es que, despuds de que se habia causado el dado 
y sus escritos habfan ayudado a restringir la in- 
migracidn, se retractd (1928), concluyendoque 
la debilidad mental no era incurable y que no 
era ncccsario recluir a los ddbiles mcntales en 
institucioncs. 

El capflulo sobre Goddard en la historia de 
las pruebas sirve para recordar que incluso las 
personas bien intencionadas, que operan den- 
tro de normas sociales aceptadas en tdrminos 
generates, pueden hacer uso incorrecto de las 
pruebas psicoldgicas. Siempre se debe tener 
presente que la “ciencia” desinteresada puede 
vinculurse con las metas de una ideologfa so¬ 
cial pcmiciosa. 


I invenci6n de las pruebas 

NO VERBALES A PRINCIPIOS 
DEL SIGLO XX 


Debido al dnfasis de las escalas Binet-Simon 
en las habilidades verbales, muchos psicdiogos 
se dieron cuenta de que este nuevo instrumen- 
to de medicidn no era totalmente apropiado para 
personas no angloparlantes, analfabetas o con 
problemas de audicidn y lenguaje. Por tal mo¬ 
tive, despuds de la traduccidn de Goddard para 
la Binet-Simon de 1908, surgid un torrente de 
escalas de ejecucidn. Aquf sdlo se proporcio- 
nari una breve cronologfa de las pruebas no 
verbales. El lector interesado debe consultar a 
DuBois (1970). En su listado de las primeras 
pruebas de ejecucidn, el lector encontrari con 
toda seguridad muchos instrumentos y sub- 
pruebas que aun estin en uso. 


La primera de las medidas de ejccucidn fue 
el tablero Seguin de figuras, una base vertical 
con depresiones en las que se pueden colocar 
10 bloques de diversas formas. Seguin lo utili- 
zd como medio de entrenamiento para indivi- 
duos con retraso, pero despuds Goddard lo 
empled como prueba y posteriormente R. H. 
Sylvester (1913) lo estandarizd. En la baterfa 
de pruebas ncuropsicoldgicas Halstead-Reitan 
aun sc utiliza un tablero iddntico, para lo cual 
se vendan los ojos del sujeto (Reitan y Wolfson, 
1985). 

Knox (1914) disehd varias pruebas de eje¬ 
cucidn para utilizarlas con los inmigrantes en 
la isla Ellis. Sus pruebas no requerfan ningun 
tipo de respuesta verbal de parte de los sujetos. 
El examinador demostraba de mancra no verbal 
las tareas para garantizar que los examinandos 
comprcndfan las instruccioncs. Dentro de esta 
prueba se inclufan un rompecabezas simple de 
madera (al que Knox denominaba prueba para 
"morones”) y la misma prueba de sustitucidn 
de sfmbolos y dfgitos que se encuentra ahora 
en la mayor parte de las escalas Wechsler de 
inteligencia. 

Varias de las primeras pruebas de ejecu¬ 
cidn son dignas de una mencidn breve debido a 
que han sobrevivido hasta la actualidad ya co- 
rregidas. Pintner y Paterson (1917) inventaron 
una escala de pruebas de ejecucidn en 15 par¬ 
tes que utilizaban varios tableros de figuras, 
rompecabezas y pruebas de ensamblc de obje- 
tos. Esta tiltima —que consiste en reconstruir 
partes de cartdn recortadas de un objeto comun, 
como un caballo— es un pilar de varias prue¬ 
bas contemporincas de inteligencia. La de Di- 
sefios con Cubos de Kohs (Kohs, 1920), que 
requerfa que la persona ensamblara cubos pin¬ 
tados para reproducir un patrdn, es muy cono- 
cida para cualquier examinador modemo que 
utilicc las escalas Wechsler. La Prueba Porteus 
de Labcrintos (Porteus, 1915) consiste en una 
serie graduada de laberintos en los cuales cl 
sujeto debe evitar los callcjoncs sin salida, mien- 
tras traza un camino desde el principio hasta el 
fin. £ste es un buen instrumento que todavfa 
esti disponible en la actualidad, pero se le uti¬ 
liza muy poco. 
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■ LA STANFORD-BINET: PRIMER 

APOYODELa _ 

Aunque fue Goddard quien tradujo por primera 
vez las escalas Binet en EUA, fue un profesor 
de Stanford, Lewis M. Terman (1857-1956), 
quien popularizd las pruebas de Cl revisadas 
de las escalas Binet en 1916. La nueva Stanford- 
Binet (asf se le llam6) no sdlo fue una extcn- 
sidn de las primeras escalas Binet, sino una 
revisidn sustancial. Entre los muchos cambios 
que condujeron al prestigio incuestionable de 
la Stanford-Binet, se encontraba el uso del ahora 
familiar Cl para cxpresar los resultados de la 
prueba. Se aumentd a 90 el ntimero de los 
reactivos y la nueva cscala era adecuada para 
individuos con retraso mental, niilos y adultos 
tanto normales como “superiores”. Ademis, la 
Stanford-Binet ten/a instrucciones claras y bien 
organizadas para aplicacidn y califlcaci6n. 
Se tuvo gran cuidado en garantizar una mues- 
tra representativa de sujetos para la estandariza- 
ci6n de la prueba. Como sefiala Goodenough 
(1949): “La publicacidn de la Revisi6n Stanford 
sefiald el fin del periodo inicial de experimen- 
tacidn e incertidumbre. De una vez por todas, 
el examen de la inteligencia se habfa colocado 
sobre una base fume.” 

La Stanford-Binet constituyd por decenios 
la norma para las pruebas de inteligencia. 
Las nuevas pruebas se validaban siempre en 
tdrminos de sus correlacioncs con esta mcdida, 
que continud a lo largo de sus revisiones en 
1937 y 1960, momento en el cual las escalas 
Wechsler (Wechsler, 1949, 1955) habfan em- 
pezado a competir con ella. La ultima revisidn 
de la Stanford-Binet se concluyd en 1986. Esta 
prueba y las escalas Wechsler se analizan con 
detalle en un capftulo posterior. Es necesario 
mcncionar aquf que las escalas Wechsler se 
volvieron una altemativa muy popular para la 
Stanford-Binet, principalmentc debido a que 
proporcionaban mis de una puntuacidn de CL 
Ademis del Cl Total, las escalas Wechsler pro¬ 
porcionaban de 10 a 12 puntuaciones de 
subprueba y un Cl Verbal y uno de Ejecuci6n. 
En contraste, las versiones anteriores de la 
Stanford-Binet sdlo proporcionaban una pun- 
tuacidn general de resumcn, el Cl global. 


I PRUEBAS GRUPALES Y 

clasificaci6n de reclutas 

DEL EJERQTO EN LA PRIMERA 
GUERRA MUNDIAL 


Dada la tendencia estadounidense por la efi- 
ciencia, era natural que los investigadores 
buscaran pruebas mentales de grupo que com- 
plementaran a las pruebas de inteligencia in¬ 
dividuates importadas de Francia, las cuales 
consumfan relativamente demasiado tiempo. 
Entre los primeros en desarrollar pruebas 
grupales sc encontraba Pyle (1913), quien pu- 
blicd normas para ninos en edad escolar para 
una baterfa que inclufa medidas tan trilladas 
como capacidad de memoria, sustitucidn de 
sfmbolos y dfgitos y asociacidn de palabras ora¬ 
tes (escribir ripidamente palabras en respuesta 
a una palabra estfmulo). Pintner (1917) revisd 
y aumentd la baterfa de Pyle, afiadidndole una 
prueba de eliminacidn con Ifmite de tiempo, en 
la que el nifio tachaba la letra a cada vez que 
aparecfa en un texto. 

Pero las pruebas grupales tardaron en al- 
canzar la popularidad, en parte debido a que 
las primeras versiones todavfa tenfan que cali- 
ficarse de manera laboriosa a mano. La idea de 
una prueba completamente objetiva con una 
clave de calificacidn simple era inconsistente 
con pruebas como memoria I6gica, para cuya 
calificacidn se requcrfa el juicio del examina- 
dor. Lo mis sorprcndcntc de todo —al menos 
para cualquiera que haya pasado algun tiempo 
con un alumno en una escuela en EUA— es 
que las preguntas de opcidn multiple todavfa 
no se utilizaban de manera general. 

El paso lento de los avances en cuanto a 
pruebas grupales se elev6 de modo notable 
cuando EUA entr6 a la primera Guerra Mun- 
dial en 1917. Fue entonces que Robert M. 
Yerkes, un conocido profesor de psicologfa en 
Harvard, convened al gobiemo y al ejircito de 
que sus 1.75 millones de reclutas deberfan 
pasar por una prueba de inteligencia con pro- 
pdsitos de clasificacidn y asignacidn (Yerkes, 
1919). De inmediato, al ser comisionado den- 
tro del ejdrcito con el grado de coronet, Yerkes 
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organize un Comitd de Examen dc Reclutas, 
que se reuni6 en la escuela Vineland, en Nueva 
Jersey, para desarrollar el nuevo grupo de prue- 
bas para la evaluacidn de los reclutas. Ycrkes 
presidid dicho comitd y otros miembros famo- 
sos incluyeron a Goddard y Terman. 

De esta colaboracidn surgieron dos prue- 
bas grupales: la Army Alfa y la Army Beta. 
Serfa dificil sobrestimar la influencia dc dichas 
pruebas sobre las subsecuentes de inteligencia. 
Su formato y contcnido inspiraron las dcsarro- 
llos dc pruebas grupales e individuales durante 
los siguicntes dcccnios. Se analizard con cierto 
detalle dstas, de modo que cl lector pucda apre- 
ciar su influencia sobre las pruebas modcmas 
de inteligencia. 


EXAMEN ES ARMY ALIA Y BETA 

La Army Alfa se basd en el trabajo aun no pu- 
blicado de Otis (1918) e inclufa ocho pruebas 
con carga verbal para reclutas que tenfan desde 
un funcionamicnto promcdio hasta uno supe¬ 
rior. Las ocho pruebas eran: 1) seguimicnto dc 
instrucciones orales; 2) razonamiento aritmdtico; 
3) juicio practice; 4) pares dc sindnimos-antd- 
nimos; 5) oracioncs desordenadas; 6) llenado 
de series de ndmeros; 7) analogfas y 8) infor- 
macidn. La figura 1-1 muestra algunos reacti- 
vos tfpicos del examen Army Alfa. 

La Army Beta era una prueba grupal no 
verbal diseftada para individuos analfabelas y 
reclutas cuyo primer idioma no era el inglds. 


SEGUIMIENTO OE INSTRUCCIONES ORALES 

Marque una cruz en el primer y tercer clrculos: 

o o o 

O O 

RAZONAMIENTO ARITMFTICO 

Resuelva cada problems 

/.CuAnlos son 5 hombres mis 10 hombres? 

Respuesta () 

Si 3h toneladas de carbon cuestan $21, /.cuAnto costarAn 5Vi toneladas? 

Respuesta () 

JUICIO prActico 

t Por que las monlahas alias estAn cubiertas de nieve? Porque 


□ estAn cerca de las nubes 

□ el sol brilla en raras ocasiones sobre ellas 

□ el aire es frfo en ese lugar 


PARES DE SINdNIMOS-ANT6NIMOS 

/.Las sigulenies palabras son iguales u opuestas? 
generosldad-donacidn 

/.Iguales? u /.opuestas? 

acumular-dbipar 

/.Iguales? u /.opuestas? 

ORACIONES DESORDENADAS 

/.Las slguienles palabras poeden reordenarse para former una oracidn? 
envldia malos maldad rasgos son y 

/.cierto? o /.(also? 

COMPLETAR DE SERIES DE NUMEROS 

Complete la sene: 3 6 8 16 18 36 . 

ANALOGlAS 

/.CuAI opcxjn oompteta la analogla? 
lAgrlmas-pena: risa- 

gozo sonrisa niftas mueca 

granero-trigo : biblloleca- 

escntorio libros papel blbiotecaha 

informaciDn 

Elija la mejor allernativa: 

El pAncreas se encuenlra en el 

abdomen cabeza hombro cuelio 

La Batalla de Gettysburg se peted en 

1863 1813 1778 1812 

Note: Los examlnados reciblan instrucciones orales para cada subprueba 



Figura 1-1. Reactivos muestra det examen Army Alfa. 

Fuente: Reproducido do Yerkes, R. M. (ed.) (1921). Psychological examining in the United Slates Army. Memoirs of the 
National Academy of Sciences. Volumen 15. Con autorizacidn de la National Academy ol Sciences. Washington, DC. 
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Inclufa varias pruebas visoperceptuales y mo- 
toras, como seguir un camino en un laberinto y 
visualizar el numero correcto de cubos repre- 
sentados cn un dibujo tridimensional. La figu¬ 
re 1-2 presenta las dcmostracioncs dc pizarrdn 
para las ocho partes del examcn Army Beta. 


A fin de dar cabida a los sujetos analfabe- 
tas y a los inmigrantes recientes que no com- 
prcndian cl inglds, Yerkes instruyd a los 
examinadones para que utilizaran mdtodos que 
eran en gran medida pictoricos y expresivos, 
para cxplicarles las pruebas a los futuros reclutas 




Prueba 5 


62 

6 2 

5 9 

5 G 

3 2 7 

3 2 7 

2 4 9 

2 19 

15 36 

1536 

3 7 4 5 

3 7 4 5 

4SO 1 0 

4 5 0 0 1 

G 20 1 9 

620 19 



Flgura 1-2. Demostracfones de pizarrdn 
de las ocho partes del examen Beta 
Fuente: Reproducido de Yerkes, R.M. 
(ed.) (1921). Psychological examining in 
the United Stales Amy. Memoirs ol the 
National Academy ol Sciences. Volumen 
15. Con autorizacldn de la National 
Academy of Sciences. Washington, DC. 


Prueba 7 


ran 

□ 

r n 

ra7 : 

□ 
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del ejdrcito. El examinador y su ayudante se 
encontraban de pie sobre una plataforma al fren- 
te de la clase y Uevaban a cabo pantomimas 
para explicar cada una de las ocho pruebas. Se 
reproducirfn aquf las instrucciones exactas para 
una prueba, de modo que el lector pucda eva- 
luar los probables cfcctos de los procedimien- 
tos de prueba sobre los resultados del examen 
Beta. Tdngase en mente que muchos reclutas 
no podfan ver o cscuchar bien al examinador y 
que algunos nunca habfan realizado una prueba 
antes. Aquf se presenta edmo los examinado- 
res introduefan la prueba seis, dibujos incom- 
pletos, a cada nuevo salon llcno de reclutas 
potenciales: 

"Esta es la prueba 6. Vean. Muchos dibujos". 
DespuOs de que todos han encontrado el lugar, 
"ahora vean*. El examinador senala con la mano 
y le dice al demostradoc “Andglento". E demos- 
trador no hace nada, pero parece conluso. El 
examinador seftala al dibujo de la mano y des¬ 
puds al lugar donde lalla el dedo y le dice al 
demostradoc “Arrdglelo; arrdglelo". Entonces el 
demostrador dibuja el dedo. B examinador dice: 
"Correcto". Entonces el examinador sehala al pez 
y al lugar para el ojo y dice: “ArrdgleJo”. Despues 
de que el demostrador ha dibujado el ojo faltanle, 
el examinador seftala a los cuatro dibujos res¬ 
tates y dice: "Arrdglelos todos". El demostrador 
soluciona las muestras con lentitud y aparente 
dificultad. Cuando se ha terminado con las mues¬ 
tras, el examinador dice: "Bien. Prosigan. |Apre- 
surense!" Durante el curso de esta prueba los 
ordenanzas caminan por la habitacidn y local!- 
zan a los individuos que no estdn haciendo nada, 
sehalan a sus pdglnas y dicen: "ArrOglelo. Arre- 
gle todos”, intentando que todos trabajen. Al fi¬ 
nal de Ires mlnutos, el examinador dice. “jAltol 
Pero no den vuetta a la hoja' (Yerkes, 1921). 

La prueba del ejdrcito tenfa el propdsito de ayu- 
dar a aislar y eliminar a las personas con in¬ 
competence mental, clasificar a los varoncs 
segun su capacidad mental y asistir cn la asig- 
nacidn de los varones competentes en los pues- 
tos de responsabilidad (Yerkes, 1921). Sin 
embargo, cn realidad no ha quedado claro si el 
ejdrcito utilizd la totalidad de las grandes can- 
tidades de datos proporcionados por Yerkes y 
sus entusiastas ayudantes. Una Icctura cuida- 
dosa de sus memorias revela que Yerkes logro 


poco mSs que producir los testimonialcs favo- 
rables de los oficiales de alto rango. En lo fun¬ 
damental, sus memorias dicen que el ejdrcito 
pudo haber ahorrado millones de ddlares e 
increment ado su eficacia si se hubieran cmplca- 
do los datos de las pruebas. 

En cicrto sentido, las montafias de datos 
de prueba tuvieron ese impacto prilctico tan li- 
mitado sobre la eficacia del ejdrcito, debido a 
la resistencia de la mentalidad militar ante la 
innovacidn cientffica. Sin embargo, tambidn es 
cierto que los oficiales de mayor rango en cl 
ejdrcito tenfan buenas razoncs para dudar de la 
validez de las resultados de prueba. Por ejem- 
plo, un memorandum intemo dcscribid el uso 
de la pantomima en las instrucciones para el 
examen no verbal Beta como: 

En boneficio de coder comparer los resultados 
de diversos campamentos, los examlnadores 
recibieron la orden de seguir una cierta serie de- 
tallada y especffica de extravagancies de ballet, 
que no s6k> tuvieron el m6rito de ser totalmente 
Inoomprensibles y no relacionadas con la prue¬ 
ba mental, sino que tambidn se prestaron a una 
atmdsfera mistica sumamente confusa y 
distractora para todo el desempeho, con io que, 
en efecto, se impidld todo acercamlento a la ac- 
titud en la que debe estar el sujeto mientras se 
examina su alma (citado en Samel son, 1977). 

Adem4s, las condiciones de prueba dejaron 
mucho que desear, con oleadas de reclutas que 
se conducfan por una puerta, se someifan a prue¬ 
ba y virtualmente se sacaban a empujones por 
el otro lado. Decenas de miles de reclutas reci¬ 
bieron un cero literal en muchas subpruebas, 
no a causa de que fucran retrasados, sino por- 
que no podfan desentrafiar las instrucciones para 
estos instrumentos nuevos y enigmdticos. Mu¬ 
chos reclutas se quedaban dormidos mientras 
los examinadores daban estas instrucciones eso- 
tdricas y misteriosas a travds de pantomima. 

En cuanto al lado positivo, las pruebas del 
ejdrcito proporcionaron a los psicdlogos una 
importante cantidad de experiencia en lo que 
se reftere a la psicometrfa de la construccidn 
de pruebas. Se calcularon miles de coeficien- 
tes de correlacidn, incluyendo el notable uso 
de correlaciones multiples, en el an&lisis de los 
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datos de prueba. La construccidn de pruebas 
avanzd de ser un arte a convertirse en una cien- 
cia en el curso de unos cuantos anos. 

LAS PRUEBAS Da EJERCITO 
Y LAS DIFERENCIAS ETNICAS 

Por dcsgracia, en ocasioncs los resultados de 
las pruebas del ejdrcito se utilizaron para fun- 
damentar prcjuicios sobre diversos grupos 
raciales y etnicos, en lugar de investigar de ma- 
ncra desapasionada las causas de las difcrcn- 
cias cntrc grupos. Por ejemplo, en su influyente 
libro /\ Study of American Intelligence , Brigham 
(1923) emprendid un anAlisis masivo de las 
puntuaciones Alfa y Beta de los inmigrantes 
ndrdicos, mcditerrdneos y alpinos. El texto estA 
lleno de cuadros y grAficas ostensiblemente ob- 
jetivos que comparan a grupos raciales y 
dtnicos, como una curiosa figura presentada en 
su libro que rcprescnta la proporcidn de cada 
muestra de inmigrantes en o por debajo del pro- 
mcdio de los reclutas afroestadounidenses. 
Brigham concluyd que este grupo, los inmigran¬ 
tes mediterrAneos y los inmigrantes alpinos, era 
intelectualmcntc inferior. Alertd en cuanto a que 
la mczcla entre razas producirfa de manera in¬ 
variable un deterioro de la inteligencia esta- 
dounidense. Por ejemplo, el pic de figura para 
una de las grAficas dice, en parte: 

Distribuciones de las punluaclones de inteligen¬ 
cia de todo el grupo ndrdico, combinacidn de los 
grupos medlterrAneo y alpino y para los reclutas 
negros. El proceso de mezda Interracial no pue- 
de resultar en otra cosa que no sea un prome- 
dio de estos elementos, con el resultante dete- 
rioro de la Inteligencia estadounidense (Brigham, 
1923). 

Sicte anos despuds, Brigham (1930) se retractd 
de manera franca de sus antcriorcs pcrspectivas. 
Cit<5 las difcrencias culturales y del lenguaje 
como la probable causa de las disparidades 
dtnicas y raciales en las pruebas del ejdrcito. 
Aseverd que no podfan realizarse estudios com- 
parativos de los grupos nacionales y raciales 
con las pruebas existentes y concluyd que sus 
anteriores conclusiones "no tenfan fundamcn- 
to" (Brigham, 1930). 


M PRIMERAS PRUEBAS EDUCAT1VAS 


Para bien o para mal, el csqucma grandioso de 
Yerkes para someter a prueba a los reclutas del 
ejdrcito ayudo a iniciar la era de las pruebas 
grupales. Despuds de la primera Guerra Mun- 
dial se acumularon las preguntas de la indus- 
tria, las escuelas publicas y las universidades 
acerca de las potenciales aplicacioncs de estas 
sencillas pruebas que casi cualquicr persona 
podfa aplicar y calificar (Yerkes, 1921). Los 
psicdlogos que habfan trabajado con Yerkes 
dejaron pronto el servicio mi I i tar y se llevaron 
con cllos a los campos industrial y educativo 
su rccidn encontrado concepto de las pruebas 
de inteligencia de lApiz y papel. 

Las pruebas Army Alfa y Beta tambidn 
pasaron al uso general. Con rapidez, estos exA- 
menes se volvieron el prototipo para una gran 
familia de pruebas grupales e influyeron sobre 
el carActer de las pruebas de inteligencia, exA- 
mencs de admisidn a las universidades, prue¬ 
bas de rendimiento escolar y pruebas de aptitud. 
Para citar sdlo una consecuencia especffica de 
las pruebas del ejdrcito, el National Research 
Council, una organizacidn gubernamental de 
cientfficos, disefid la Prueba Nacional de Inte- 
ligcncia, que en un momento dado se aplied a 
siete millones de nihos en EUA durante el de- 
cenio de 1920. Asf, pruebas tan conocidas como 
las escalas Wechsler, la Prueba de Aptitud Es¬ 
colar y el Examen de Seleccidn para Posgrado 
tienen en realidad rafees que Megan hasta 
Yerkes, Otis y las pruebas masivas de reclutas 
del ejdrcito durante la primera Guerra Mundial. 

El comitd de Examen de Ingreso a la Uni- 
versidad (CEEB, del inglds College Entrance 
Examination Board) se establecid a inicios del 
siglo XX para evitar la duplicacidn en los exA- 
mcnes a los solicitantes de universidades en 
EUA. Los primeros examenes habfan tenido el 
formato de respuesta de ensayo corto, pero esto 
se cambid rApidamente cuando C. C. Brigham, 
un discfpulo de Yerkes, se convirtid en secre- 
tario de la CEEB despuds de la primera Guerra 
Mundial. En 1925, el Comitd Universitario dc- 
cidid construir una prueba de aptitud escolar 
que se utilizarfa en las admisiones a la universi- 
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dad (Goslin, 1963). Las nuevas pruebas reflc- 
jaron cl formato objetivo ahora familiar dc or- 
denamicnto de oraciones. complctamicnto de 
analogias y llenado del numcro siguiente en una 
secuencia. En cl dccenio de 1930 se introdujo 
la calificacidn a iraves de miquinas, con lo cual 
sc hizo que las pruebas grupales objetivas fue- 
ran incluso mis eficaces que antes. Estas prue¬ 
bas han evolucionado desde cntonccs hasta llegar 
a las actualcs del Comitd Universitario, en particu¬ 
lar la Prueba dc Aptitud Escolar, que se conoce 
ahora como Prueba de Evaluaci6n Escolar 
(Scholastic Assessment Tests). 

Las funciones de la CEEB se supeditaron 
luego al Servicio de Eximenes Educativos 
(ETS, del inglds Educational Testing Service), 
una organizacidn sin fines de lucre. El ETS di- 
rigidcl desarrollo, cstandarizacidn y validation 
dc pruebas tan conocidas como el Examen de 
SelecciOn para Posgrado. la Prueba de Admisio- 
nes para la Escuela de Leyes y las Pruebas de 
Ingrcso al Cuerpo de Paz. 

Mientras tanto. Terman y sus colaboradores 
en Stanford se encontraban ocupados desarro- 
llando pruebas estandarizadas dc rendimiento. 
La Stanford Achievement Test (Prueba Stanford 
dc Aprovechamiento, SAchT) fuc la primera 
publicada en 1923; una versiOn moderna se 
encuentra actual mente en uso. Desde su inicio, 
la SAchT incorporO principios psicomdtricos 
modernos como la obtencidn dc normas para 
subpruebas, dc modo que pudiera evaluarse la 
variabilidad intrasujeto y la seleccidn de una 
muestra muy grande y representativa de 
estandarizacidn. 


® DESARROLLO DE LAS PRUEBAS 
BDE APTITUD 


Las pruebas de aptitud miden capacidadcs mis 
especfficas y delimitadas que las de inteligen- 
cia. Por tradicidn, estas ultimas evaluan un 
constructo mis global como la inteligencia ge¬ 
neral, aunque existen excepciones a esta ten- 
dencia que sc analizarin despuds. En contraste, 
una prueba dc una sola aptitud mediri sdlo un 


dominio de capacidad, y una baterfa de prueba 
de aptitud multiple proporcionari las puntua- 
ciones de varias ireas de capacidad. 

El desarrollo dc las pruebas de aptitud se 
rezagd con rcspecto al de las pruebas de inteli¬ 
gencia debido a dos razones, una estadfstica y 
la otra social. El problems estadfslico rcsidfa 
en que. con frccuencia, se necesitaba una nue- 
va tdcnica, el anilisis factorial, para discemir 
cuiles aptitudes eran primordiales y, por tanto, 
dislinguirlas entre s(. Spearman (1904) habfa 
comenzado de manera bastante temprana con 
la investigaciOn sobre este asunto, pero el mi- 
todo no se perfeccionO sino hasta el decenio de 
1930 (Spearman, 1927; Kelley, 1928;Thurstonc, 
1938). Esta nueva familia dc t&nicas, el anilisis 
factorial, Ic permitid a Thurstone concluir que 
habfa factores especfficos de capacidad mental 
primaria como comprensidn verbal, fluidez dc 
vocabulario, facilidad numdrica, capacidad es- 
pacial, memoria asociativa, velocidad percep¬ 
tual y razonamiento general (Thurstone, 1938; 
Thurstone y Thurstone, 1941). En capilulos 
posteriores se diri mis sobre el tema de las prue¬ 
bas de inteligencia y capacidad. El punto im- 
portantc en este momento es que Thurstone y 
sus seguidores consideraron que, por un decir, 
las medidas globales dc inteligencia no "des- 
menuzaban a la naturaleza”. Como resultado, se 
pensd que las medidas como la Stanford-Binet 
no eran utiles como batert'as de prueba de apti¬ 
tudes multiples para determinar las fortalezas y 
dcbilidadcs intelccluales de una persona. 

La segunda raz6n para el lento crccimicn- 
to de las baterfas dc aptitud fue la auscncia de 
una aplicacidn prictica para dichos instrumen- 
tos refinados. No fue sino hasta la segunda 
Guerra Mundiat que surgid una necesidad 
urgente de seleccionar candidatos altamente 
calificados para tarcas muy diffeiles y especia- 
lizadas. Los requisitos de trabajo de los pilotos, 
ingenieros de vuelo y copi lotos eran muy espe¬ 
cfficos y demandantes. Un estimado general dc 
la capacidad intclcctual, como el que propor- 
cionaban las pruebas grupales de inteligencia 
ulilizadas en la primera Guerra Mundial, no era 
suficiente para clegir buenos candidatos para la 
escuela de vuelo. Las fuerzas armadas resol- 
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vieron este problcma desarrollando una batcrfa 
cspecializada de aplitud con 20 pruebas que se 
aplicaba a las varones que aprobaban las prue¬ 
bas de seleccidn preliminares. Estas medidas 
resultaron invaluables para seleccionar pilotos, 
copilotos y bombarderos, como se rcflcjd en 
las tasas mucho mis bajas de fracaso de los 
varones seleccionados con la batcrfa de prue¬ 
bas, en vez de con los viejos mdtodos (Goslin, 
1963). Dichas pruebas todavfa se utilizan am- 
pliamcnte en las fucrzas armadas. 


I PRUEBAS DE PERSONALIDAD 
Y VOCACIONALES DESPUES DE 
LA PRIMERA GUERRA MUNDIAL 


Aunque Galton, Kraepclin y otros habfan utili- 
zado mdtodos de evaluacidn tan rudimentarios 
como la tlcnica de asociacidn libre desde antes 
de principios de siglo, no fue sino hasta la pri- 
mera Guerra Mundial que las pruebas de per- 
sonalidad surgicron con una forma parecida a 
su apariencia actual. Como ha sucedido con 
tanta frecuencia en la historia de las pruebas, 
fue de nuevo una necesidad prdctica lo que sir- 
vi6 como fmpetu para este nuevo dcsarrollo. 
Las pruebas modernas de personalidad co- 
menzaron cuando Woodworth intentd desa- 
rrollar un instrumento para detectar a los 
reclutas del cjdrcito que fueran susceptiblcs a 
la psico-neurosis. Casi todos los inventarios y 
cuestionarios modemos de personalidad ticncn 
una deuda con la Woodworth i Personal Data 
Sheet (Hoja de Datos Biograficos de 
Woodworth, 1919). 

Este instrumento inclufa 116 preguntas que 
el sujeto debfa responder subrayando Si o No. 
Las preguntas eran exclusivamente de la varie- 
dad “evidente a primera vista" y en su mayorfa 
implicaban sintomatologfa bastante grave. 
Rcactivos representatives inclufan: 

• j,Las ideas pasan por tu mente de mancra que 
no te permiten dormir? 

• iSe te consideraba como un nino malo? 


• lie sientes perturbado por un sentimiento de 
que las cosas no son reales? 

• iTicncs un fuerte deseo de suicidarte? 

Con toda seguridad, los lectores familiarizados 
con el Inventario Multifasico dc la Personalidad 
(MMPI) deben reconocer la deuda que liene 
este inventario mds recicnte con el instrumento 
de Woodworth. 

De su explicaci6n acerca de c6mo se desa- 
riolld la Hoja de Datos Biograficos (Woodworth, 
1951), queda claro que Woodworth tuvo gran 
cuidado en la seleccidn de los reactivos. A pc- 
sar de ello, en otros sentidos este instrumento 
engloba una enorme dosis dc credulidad psi- 
comdtrica. El problema mds grave reside sim- 
plemente en que un sujeto trastomado que tenga 
la motivacidn de quedar bien podrfa lograrlo 
sin que sc le dctcctara; de la misma mancra, un 
sujeto normal con una mental idad de dar una 
mala impresion, podrfa categorizarse como 
incapaz para cl servicio militar. Los instrumcn- 
tos modemos como el MMPI han incorporado 
diversas escalas de validcz para detectar estas 
tcndcncias de respuesta. En contraste, la Hoja 
de Datos Biogrdficos se fundamentaba en la 
suposicidn dc que los sujetos serfan sinceros al 
responder a las preguntas. 

El siguientc dcsarrollo importante fue un 
inventario de neurosis, el Inventario de Perso¬ 
nalidad de Thurstone (Thurstone y Thurstone, 
1930). Despuds de seleccionar primero miles 
de reactivos que se pudicran responder con Sf- 
No, del inventario de Woodworth y dc otras 
fuentes, Thurstone adaptd de manera racional 
los reactivos en tdrminos de la forma en que un 
neurdtico responderfa tfpicamcntc a ellos. Como 
un reflejo de la inclinacidn de Thurstone hacia 
cl rcfinamiento estadfstico, este inventario fue 
uno de los primeros en utilizar el mdtodo dc con- 
sistencia interna, donde cada posible reactivo 
se correlaciond con la puntuacidn total en una 
escala tentativamente identificada, para deter- 
minar si dicho reactivo perteneefa a dsta. 

De la prueba Thurstone surgid Bemreuter 
Personality Inventory (Inventario de Persona¬ 
lidad de Bernreuter; Bernrcutcr, 1931). Fue un 
poco mds refinado que su prcdecesor en la 
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medicidn de cuatro dimensioncs de la persona- 
lidad: tendencia neurdtica, autosuficiencia, in- 
troversidn-extraversidn y dominancia-sumisidn. 
Una de las principales innovaciones en cuanto 
a construccidn de pruebas fue que un solo 
reaclivo de prueba pod fa contribuir a mds de 
una cscala. 

El Estudio de Valorcs de Allport-Vemon 
tambidn se publicd en 1931 (Allport y Vemon, 
1931). Esta prueba fue baslantc difcrentc de las 
otras en cuanto a que medfa valorcs en lugar de 
psicopatologfa. Lo que es mds, adoptd un nue- 
vo mdtodo de calificacidn, el enfoque ipsativo, 
en cl que sdlo se establece una comparacidn de 
la persona consigo misma con respecto al equi- 
librio de importancia de seis valores bdsicos 
dados: tedricos, ccondmicos, estdticos, socia- 
les, polfticos y religiosos. La prueba sc disefid 
de tal manera que se pedfa a los sujetos que 
eligieran entre los seis valores en situaciones 
especfficas. Como consecuencia, el promedio 
de las seis escalas siempre era el mis mo para 
cada sujeto. Una debilidad en un valor se com- 
pensaba con una fortalcza en algun otro. Asf, 
sdlo tenfan interds las cimas y valles relativos. 

Cualquier cronologfa de los inventarios de 
autoinforme seguramente debe incluir al Inven- 
tario Multifasico de la Personalidad (MMPI; 
Hathaway y McKinley, 1940). Esta prueba y 
su revision, el MMPI-2, se analizardn con ma¬ 
yor detalle despuds. Por ahora bastard con se- 
nalar que las escalas del MMPI se construyeron 
con el mdtodo del cual Woodworth fue el pione- 
ro, la contrastacidn de respucstas de sujetos 
normales y con trastomos psiquidtricos. Ade- 
mds, cl MMPI introdujo el uso de las escalas 
de validez para determinar patrones de respues- 
ta falsamentc malos, falsamente buenos y 
aleatorios. 


■ ORIGENES DE LAS PRUEBAS 
PROYECTIVAS 


El enfoque proyectivo sc origind con el mdtodo 
de asociacidn de palabras, cuyo pionero fue 
Francis Gaiton a finales del siglo XIX. Gallon 


se daba a sf mismo cuatro segundos para dar 
tantas asociaciones como fuera posible para una 
palabra estfmulo y despuds las categorizaba 
como repetitivas, mediadas por imdgenes o re- 
presentaciones histridnicas. Esta ultima catego- 
rfa lo convencid de que entraban en juego 
operaciones mentalcs que “estdn totalmente su- 
mergidas de bajo del nivel de la conciencia”. 
lncluso algunos historiadores han especulado 
que la aplicacidn que hizo Freud de la asocia¬ 
cidn libre como herramienta terapdutica en cl 
psicoandlisis se dcrivd del artfculo que publicd 
Gaiton en 1879 en la revista Brian (Forrest, 
1974). 

Wundt y Kraepetin continuaron en Alcma- 
nia con el trabajo de Gaiton y, finalmenle, Jung 
(1910) lo concrctd. La prueba de Jung consis- 
tfa en 100 palabras estfmulo. Para cada pala¬ 
bra, el sujeto tenia que responder lo mds rapido 
posible con la primera palabra que le viniera a 
la mente. Kent y Rosanoff (1910) le dieron al 
mdtodo de asociacidn un sabor estadounidense 
distintivo al tabular las reacciones de 1 000 su¬ 
jetos normales ante una lista de 100 palabras 
estfmulo. Estas tablas se diseflaron para pro- 
porcionar una base con la cual comparar las 
reacciones de sujetos normales y “dementes". 

Mientras en EUA se buscaba cl enfoque 
empfrico para las pruebas objetivas de perso¬ 
nalidad, el joven psiquiatra suizo Hermann 
Rorschach (1884-1922) desarrollaba un ve- 
hfculo totalmente diferente para cl estudio de 
la personalidad. Tenfa una fuerte influencia del 
pensamiento jungiano y psicoanalftico.de modo 
que era natural que su nuevo enfoque se cen- 
trara en la tendencia de los pacicntcs a revelar 
de manera inconsciente sus conflictos mds pro- 
fundos cuando respondfan ante estfmulos ambi- 
guos. El Rorschach y otras pruebas proyectivas 
que se analizan mas adelante se fundamentaron 
en la hipdtesis proyectiva: cuando se responde 
ante estfmulos ambiguos o no estructurados, se 
revclan de modo inadvertido necesidades, fan- 
tasfas y conflictos m£s profundos. 

Rorschach cstaba convencido de que las 
personas revelaban importantes dimensiones de 
la personalidad en sus respuestas ante manchas 
de tinta. Pas6 aiios desarrollando el conjunto 
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dc 10 manchas dc tinta y sistemdticamente ana- 
iiz 6 las respuestas de sus amigos y de diversos 
grupos de pacientes (Rorschach, 1921). Por 
desgracia, murid sdlo un ado despuds de que se 
publicd su monograffa y a otros les quedd la 
tarea de terminar su trabajo. Los dcsarrollos en 
cuanlo al Rorschach se revisan posteriormente 
dentro del texto. 

Mienlras la prueba de Rorschach se desa- 
rrolld inicialmente para revelar el fiincionamicn- 
to mds profundo del sujeto anormal, el TAT o 
Test de Apercepcidn Temdtica (Morgan y 
Murray, 1935) se elabord como un instrumento 
para estudiar la personalidad normal. Por su- 
puesto, desde entonces ambos se han ampliado 
para examinar todo el continuo de la conducta 
humana. 

El TAT consiste en una serie de ilustracio- 
nes que representan, en su mayor parte, a una o 
mds personas que participan en una interaccidn 
ambigua. Al sujeto se 1c mucstra una ilustra- 
cidn a la vez y se le pide que invente una histo- 
ria accrca de ella. Se le instruye a ser tan riguroso 
como sea posible, a que discuta los pensamien- 
tos y senlimicntos y que describa el pasado, 
presente y futuro de lo que se representa en la 
Idmina. 

Murray (1938) consideraba que las necesi- 
dades subyacentes de la personalidad, como la 
necesidad de logro, se rcvelarfan en el conteni- 
do de las historias. Aunque sc han desarrollado 
numerosos sistemas de calificacidn, en general 
los clfnicos han dependido del andlisis impre- 
sionista para llegar a conclusiones con respec- 
to a los protocolos del TAT. Las aplicaciones 
modemas del TAT se analizan en un capftulo 
posterior. 

La tdcnica de frases incompletas tambidn 
se inicid durante esta epoca con el trabajo de 
Payne (1928). Se han rcalizado numerosas ex- 
tensiones y variaciones de la tdcnica, que con- 
sistc en darle al sujeto una parte de una oracidn 

como: “Me aburro cuando_”, y pedirle 

que la termine. Algunas aplicaciones moder- 
nas se analizaran despuds, pero por el momen- 
to se puede mencionar que el problema de la 
calificacidn e intcrpretacion, que inquietd a los 
primeros en desarrollar una prueba de frases 
incompletas, todavfa cxiste en la actualidad. 


Un enfoque totalmente nuevo de las prue¬ 
bas proyeclivas lo emprendid Goodenough 
(1926), quien tratd de dclerminar no sdlo el ni- 
vel intelectual, sino tambidn los intercses y ras- 
gos de personalidad de los nifios a travds del 
andlisis de sus dibujos. La prueba dc Buck 
(1948), llamada Tdcnica del dibujo proyectivo 
de Casa-Arbol-Persona, estaba un poco mds 
estandarizada y tenfa mayor estructura y reque- 
rfa que el sujeto dibujara una casa, un drbol y una 
figura humana. El trabajo dc Machovcr (1949) 
en Personality Projection in the Drawing of the 
Human Figure fuc una extensidn Idgica de los 
trabajos anteriores. El dibujo de la figura hu¬ 
mana como un enfoque proyectivo para com- 
prendcr la personalidad todavfa se emplea; cn 
un capflulo posterior se analizardn los avances 
modernos en esta prdctica. 

Mientras tanto, las pruebas proycctivas cn 
Europa estaban dominadas por el Szondi Test, 
un absurdo instrumento basado en premisas 
totalmente fallidas. Lipot Szondi fue un psiquia- 
tra suizo de origen hungaro que crefa que los 
principalcs trastomos psiquidtricos eran causa- 
dos por genes recesivos. Su prueba constaba 
de 48 fotograffas de pacientes psiquidtricos di- 
vididos en seis conjuntos dc los siguientes ocho 
tipos: homosexual, epildptico, sddico, histdri- 
co, catatdnico, paranoide, maniaco y depresivo 
(Deri, 1949). De cada conjunto de ocho foto¬ 
graffas, se le pedfa al sujeto que seleccionara 
aqudllas dos que mds le agradaban y las dos 
que mds le desagradaban. Se suponfa que una 
persona que dc manera consistente prefiriera 
un lipo de fotograffa entre los seis conjuntos, 
tendrfa algunos genes recesivos que le harfan 
sentir simpatfa por la persona representada. Asf, 
se suponfa que las preferencias proyectivas re- 
velaban genes recesivos que predisponfan al 
individuo a presentar trastornos psiquidtricos 
cspecfficos. 

Deri (1949) importd la prueba a EUA y 
cambid su fundamenlacidn. Esta investigadora 
no abogd por una explicacidn gendtica recesiva 
de la eleccidn de fotograffas, sino que explied 
dichas preferencias con base en la identifica- 
cidn inconsciente con las caracterfsticas de 
los pacientes fotografiados. Esta era una base 
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tebrica mbs admisible para la prueba que las 
dudosas icorfas gendlicas dc Szondi. Sin em¬ 
bargo, la investigacibn empfrica arrojb dudas 
sobre la validez de esta prueba, y cn poco tiem- 
po este inslrumcnto se quedb en el olvido 
(Borstel-mann y Klopfer, 1953). 


DESARROLLO DE LOS 
fglNVENTARIOS DE INTERESES 


Mientras los cli'nicos desarrollaban medidas 
para analizar la personalidad y los conflictos 
inconscicntes, otros psicblogos disenaban me¬ 
didas para la orientacibn y gufa psicolbgicas 
dc las grandcs conjuntos de personas mbs nor- 
males. El inventario dc iniereses fue la princi¬ 
pal dc estas medidas, cuyas rai'ccs llegan hasta 
el estudio de Thorndike (1912) sobre las ten- 
dencias del dcsarrollo de intereses de 100 es- 
tudiantes universitarios. En 1919-20, Yoakum 
desarrollb un conjunto de 1 000 reactivos rela- 
cionados con los intereses desde la infancia 
hasta la madurez temprana (DuBois, 1970). 
Muchos de cstos reactivos se incorporaron cn 
el Inventario Carnegie de Intereses. Cowdcry 
(1926-27) mejorb y refinb el trabajo anterior 
cn el instrumento Carnegie al incrementar el 
numero de reactivos. comparando las respues- 
tas de tres grupos critcrio (mddicos, ingenieros 
y abogados) con grupos control dc individuos 
no profesionales y desarrollando una fbrmula 
de ponderacibn para los reactivos. Tambibn fue 
cl primer psicbmctra cn darse cuenta de la im- 
portancia de la validacibn cruzada. Sometib a 
prueba sus nuevas escalas en grupos adiciona- 
les de mddicos, ingenieros y abogados para 
garantizar que las discriminaciones cncontradas 
en los estudios originales fueran diferencias 
grupalcs confiablcs mbs que capitalizaciones dc 
la varianza de error. 

Edward K. Strong (1884-1963) revisb la 
prueba de Cowdery y dedicb 36 aftos al desa- 


rrollo dc las pautas empfricas para el instrumen- 
to modificado como Strong Vocational Interest 
Blank (Formulario Strong dc Intereses Voca- 
cionales, SVIB). Puede calificarse a las perso¬ 
nas que realizan la prueba con claves separadas 
para varias doccnas de ocupaciones, lo cual pro- 
porciona una serie de puntuaciones de inmenso 
valor para la orientacibn vocacional. El SVIB 
se volvib una dc las pruebas de mbs amplio 
uso dc todos los tiempos (Strong, 1927). Su 
versibn moderna, el Strong Interest Inventory 
(Inventario Strong dc Intereses), todavfa se uti- 
liza de manera general cn la orientacibn voca¬ 
cional. 

Durante deccnios, el unico compctidor se- 
rio del SVIB fue cl Registro dc Preferenciiis de 
Kuder (Kuder. 1934), que diferfa del Strong en 
cuanto a que forzaba las opciones dentro dc 
trfadas dc reactivos. El Kuder era una prueba 
ipsativa, es decir, comparaba la relativa forta- 
Icza dc los intereses dentro del individuo, en 
vez de comparar las respuestas con diversos 
grupos profesionales. Las revisioncs mbs re- 
cicntes del Registro de Prefcrencias de Kuder 
incluyen la Kuder General Interest Survey (En- 
cucsta dc Intereses Generalcs dc Kuder) y la 
Kuder Occupational Interest Survey (Encuesta 
dc Intereses Ocupacionalcs de Kuder; Kuder, 
1966; Kuder y Diamond, 1979; Zytowski. 
1985). 


B resumen de los principales 

HITOS EN LA HISTORIA DE LAS 
PRUEBAS 


Se concluyc esta resefia histbrica de las prue¬ 
bas psicolbgicas con un rcsumen en forma dc 
cuadro acerca de los acontccimientos determi- 
nantes hasta 1950 (cuadro 1-2). El lector inte- 
resado podrb encontrar un listado mbs detallado 
—incluycndo cronologfa de los dcsarrollos pos- 
leriorcs a 1950— en el Apendice A. 
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Cuadro 1-2. Resumen de los primeros hitos en la historla de las pruebas 


2200 a.C. 
1862 
1884 

1890 

1901 

1905 

1914 

1916 

1917 

1917 

1920 

1921 

1927 

1939 

1942 

1949 


China comenzb con los ex£menes para el servicio publico 

Wilhelm Wundt utiliza un pdndulo calibrado para medir la “velocidad de pensamiento" 

Francis Gallon aplica la primera baleria de pruebas a miles de ciudadanos en la Exhiblcidn 
Internacional de Salud 

James McKeen Cattell utiliza el tdrmino prueba mental al anunciar los puntos esenclales 
para su baterfa galtoniana de pruebas 

Clark Wissler descubre que los “instrumentos de bronce" de Caltell no se correlaclonan 
con las calificaciones universitarias 

Binet y Simon inventan la primera prueba modema de Inteligencia 

Stem introduce el Cl o cociente de inteligencia: la edad mental dividida entre la edad 
cronoldgica 

Lewis Terman revisa las escalas Binet-Simon, publica la Stanford-Binet. Aparecen 
revisiones en 1937, 1960 y 1986 

Robert Yerkes encabeza el desarrollo de los ex&menes Army Alla y Army Beta utiiizados 
para evaluar a los reclutas de la primera Guerra Mundial 

Robert Woodworth desarrolla la Hoja de Datos Personates, la primera prueba de personalidad 
Se publica la prueba Rorschach de Manchas de Tinta 

Cattell, Thorndike y Woodworth (undan la Psychological Corporation —la primera editorial 
imporlante de pruebas 

Se publica la primera edicidn del Estudio de Intereses Vocacionales de Strong 

Se publica la Escala Wechsler-Bellevue de Inteligencia 

Revisiones publicadas en 1955, 1981 y 1997 

Publicacidn del Inventario Multifasico de la Personalidad de Minnesota 

Se publica la Escala Wechsler de Inteligencia para Nirios 

Revisidn publicada en 1974, 1991 


HI RESUMEN 


1. En 1910, Henry Goddard tradujo la escala 
Binet-Simon de 1908. En 1911, sometid a 
prueba a mds de mil escolares con base en 
las normas francesas originales. Le preocu- 
p6 el hecho de encontrar que 3% de la 
muestra fucran “ddbiles mentales" y reco- 
mendd que estos ninos se aislaran del resto 
de la sociedad. 

2. Las pruebas no verbalcs de inteligencia se 
inventaron a inicios del siglo XX para faci- 
litar el examcn de los inmigrantes que no 
eran de habla inglesa. Por ejemplo, Knox 


publied en 1914 una prueba con rompeca- 
bezas de madera y tambidn utilizd la ahora 
familiar pmeba de sustitucidn de dfgitos por 
sfmbolos. 

3. En 1916, Lewis Terman publied la Stanford- 
Binet, una revisidn de las escalas Binet. Esta 
prueba bien diseriada y con normas cuida- 
dosas, eoloed de una vez por todas al examen 
de la inteligencia sobre una base firme. 

4. Durante la primera Guerra Mundial, Robert 
Yerkes encabez6 un cquipo de psicdlogos 
que produjeron la prueba Army Alfa, una 
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prueba grupal con carga verbal para reclu- 
las promedio y superiores, y la Army Beta, 
una prueba grupal no verbal dirigida a re- 
clutas analfabetos o no angloparlantes. 

5. Los pioneros en pruebas. como C. C. 
Brigham, utilizaron los resultados de las 
pruebas individuates y grupales para fun- 
damentar las diferencias Arnicas en intcli- 
gencia y, por tanto, para justificar las 
restricciones a la inmigracidn. Posterior- 
mentc, algunos dc estos pioneros se retrac- 
taron de sus puntos de vista anteriores. 

6. Las pruebas cducativas cayeron dentro del 
dmbito del Comitd de Examen de Ingreso a la 
Universidad (CEEB), fundado a principios 
del siglo XX. En 1947, el CEEB fue reem- 
plazado por el Servicio dc Exdmenes Edu- 
cativos (ETS), que supervise la publicacidn 
de pruebas tan conocidas como la Prue¬ 
ba dc Aptitudes Escolares y el Examen de 
Seleccidn para el Posgrado. 

7. El advenimiento dc las baten'as de prueba 
de aptitudes multiples se hizo posible debi- 
do al desarrollo del andlisis factorial por 
parte de L. L. Thurstone y otros. Posterior- 
mente, la mejorfa de estas baterfas de prue¬ 
ba se vio alentada por la necesidad practice 
de seleccionar a los reclutas de la Segunda 
Guerra Mundial para puestos de alta espe- 
cializacidn. 


8. Las pruebas dc pcrsonalidad comenzaron 
con la Woodworth s Personal Data Sheet, 
una simple lista de verificacidn de sfntomas 
con respuestas de sf y no que se utilizd para 
detectar psiconeurosis en los reclutas dc la 
segunda Guerra Mundial. Muchos inven- 
tarios postcriorcs, incluycndo al popular 
Inventario Multifdsicode la Personalidad de 
Minnesota, tomaron prestado el contenido 
de la hoja de datos personates. 

9. Las pruebas proyectivas comenzaron con la 
tdcnica de asociacidn de palabras, cuyo pio- 
nero fue Francis Gallon y que concretd C. G. 
Jung en 1910. Hermann Rorschach publied 
su famosa prueba de manchas de tinta en 1921. 

10. El Test dc Apercepcidn Temdtica (TAT), una 
prueba de narracidn de historias ante ilus- 
traciones. introducida en 1935 por Morgan 
y Murray, se basd en la hipdtesis proyectiva: 
cuando responden a estfmulos ambiguos o 
no estructurados, los examinados revelan 
de manera inadvertida sus necesidades, fan¬ 
tasias y conflictos mis profundos. 

11. La evaluacidn dc los intereses vocacionalcs 
comenzd con el Carnegie Interest Inventory 
(Inventario Carnegie dc Intereses), de Yoakum, 
que sc desarrolld en 1919-20. Despuds de 
varias revisiones y extensiones, este instru- 
mento surgid como cl Strong‘s Vocational 
Interest Blank (SVIB), de E. K. Strong. ■ 



Pruebas y su proceso 
de aplicaddn 



Tema 2A 

Naturaleza y usos de las pruebas 
psicologicas 


Definici6n de una prueba 

Otras distinciones en pruebas 

Tipos de pruebas 

Usos de las pruebas 

Qtii6n puede obtener las pruebas 

Fuentes de InformackJn sobre pruebas 

Resumen 

Tbrminos y conceptos clave 

msam 



La introduccibn historica en el capftulo 
anterior s61o ha familiarizado al lector con una 
pequena fraccibn de los muchos tipos de prue¬ 
bas psicolbgicas y sus usos. Las primeras se uti- 
lizaron de mancra predominante para dos 
propbsitos: medir la inteligencia y detectar tras- 
tomos de personalidad. Por tanto, es compren- 
sible que el ciudadano promedio haga una 
equivalencia entre pruebas psicolbgicas y pun- 
tuaciones de Cl, manchas dc tinla e inventarios 
de personalidad. Con toda seguridad, en este 
punto de vista existe mds que un grano de ver- 


dad: las medidas de personalidad e inteligencia 
todavfa son los pilares esenciales de las prue¬ 
bas psicolbgicas. Sin embargo, los psicbmetras 
han dcsarrollado muchos otros tipos de estos 
instrumentos para propbsitos divcrsos c imagi- 
nativos que los pioneros nunca podrfan haber 
anticipado. Este capftulo proporciona una vi- 
sibn panorfimica de las pruebas psicolbgicas y 
de sus numerosas aplicaciones. En el tema 2A, 
Naturaleza y usos de las pruebas psicolbgicas, 
se resumen los diferentes tipos y las diversas 
aplicaciones de bstas. En el tema 2B, Proceso 
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dc Aplicacion. se enfatiza que la aplicacidn de 
prucbas cs una transaction entre el examina- 
dor y la persona evaluada, no un proceso cstd- 
ril de medicidn. 

Desde el nacimiento hasta la vejez, nos to- 
pamos con cstos instrurncntos en casi todos los 
momcntos de cambio en la vida. La primera 
prucba del bebd, realizada inmediatamcnte des¬ 
puds del nacimiento, es la prueba Apgar, una 
cvaluacidn rapida y muhivariada de la frecuencia 
cardiaca, respiracidn, tono muscular, irritabili- 
dad refleja y color (Clarke-Stewart y Friedman, 
1987). La puntuacidn total Apgar (0 a 10) ayuda 
a determinar la necesidad de cualquier tipo de 
atencidn mddica inmediata. Despuds, un infan¬ 
te que ha recibido antes una baja puntuacidn 
Apgar podrfa ser candidato para una evalua- 
cidn de discapacidadcs del desarrollo. El nino 
preescolar pucdc realizar pniebas de prcparacidn 
para la escuela. Una vez que se ha comenzado 
con la carrera escolar, cada estudiante atravicsa 
por cientos, quizd miles, de pruebas acaddmicas 
antes de graduarse (sin mcncionar las que miden 
discapacidades para el aprendizaje, inteligen- 
cia dotada, intereses vocacionales y admisidn a 
la universidad). Despuds de graduarse, los 
adultos pueden enfrentar pruebas para ingre- 
sar a un empleo, obtener la licencia de manejo, 
autorizacidn de seguridad, funcionamiento de 
personalidad, compatibilidad matrimonial, 
discapacidades del desarrollo, disfuncidn cere¬ 
bral —la lista es casi interminable. Algunas 
personas incluso se enfrentan a una ultima in- 
dignidad en la parte m£s ddbil de sus ultimos 
anos: una prucba para determinar su capacidad 
para administrar sus asuntos econ6micos. 

La idea de una prucba es, por tanto, un 
elemento que domina en nuestra cultura, una 
caracterfstica que damos por sentada. Sin em¬ 
bargo, el concepto que tiene un lego acerca de 
ellas no necesariamentc coincide con la pers- 
pectiva mis restringida que tiene un psiedmetra 
(especialista en psicologfa o cducacion que de- 
sarrolla y evalua pruebas psicoldgicas). Dcbi- 
do a los equfvocos generales en cuanto a la 
comprcnsidn dc su naturaleza, es adecuado co- 
menzar este tema con una pregunta fundamen¬ 
tal que define el campo de accidn dc todo el 
libro: i,qu6 es una prueba? 


£ , DEFINICION DE UNA PRUEBA 

Una prucba es un proccdimicnto cstandariza- 
do para tomar una muestra dc conducta y dcs- 
cribirla con categorfas o puntuaciones. Adcmls, 
la mayor parte tiene normas o estdndares, con 
base en los cuales pueden utilizarse los resulta- 
dos para pronosticar otras conductas mds im- 
portantes. En las siguientes scccioncs sc hablard 
mds sobre estas caracterfsticas, pero primero cs 
util representar el campo de accidn de la deft- 
nicidn. Incluidas dentro dc esta perspcctiva se 
cncuentran las pruebas tradicionalcs como los 
cuestionarios de personalidad y las pruebas de 
intcligencia. pero la definicidn tambidn inclu- 
ye diversos procedimientos que el lector podrfa 
no reconocer como tales. Por ejemplo, todos los 
mdtodos siguientes pueden ser pruebas, segun 
la definici6n que se utiliza en este libro: una 
lista de verificacidn para clasificar las habili- 
dadcs sociales de un joven con rctraso mental; 
una medida sin lfmitc dc tiempo del dominio 
en la suma de pares de numcros de tres dfgitos; 
valoraciones por computadora del tiempo dc 
reaccidn; e incluso, pruebas situacionalcs como 
la observacidn de un individuo que trabaja en una 
tarca de grupo con dos “ayudantes" poco co- 
operativos y que s61o le causan dificultades. 

En suma, las pruebas son sumamente va- 
riadas en sus formatos y aplicacioncs. Sin em¬ 
bargo. la mayor parte posee estas caracterfsticas 
que las deftnen: 

• Procedimiento estandarizado. 

• Muestra de conducta. 

• Puntuaciones o categorfas. 

• Normas o est^ndares. 

• Prcdiccidn de conducta fuera de la prueba. 

En las siguientes secciones se analizardn con 
m£s detaile cada una de estas caracterfsticas. 
La imagen que se desea representar tiene que 
ver en especial con las pruebas referentes a la 
norma —las que utilizan una poblacidn bien 
definida de personas para su esquema in¬ 
terpretative. Sin embargo, las caracterfsticas 
definitorias de una prueba difteren un tanto en 
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el caso especial de las pruebas referidas a crite- 
rio —las que miden lo que una persona puede 
hacer, cn lugar de comparer los resullados con 
los niveles de desempeno de otros. Por tal ra- 
zdn, se tratan por separado las pruebas referi¬ 
das a criterio. 

El procedimiento estandarizado es una 
caractcrfstica esencial de cualquier prueba psi- 
coldgica. Se considera que una prueba esti 
estandarizada si los procedimientos para su 
aplicacidn son uniformes de un examinador a 
otro y de un ambiente a olro. Por supuesto, la 
estandarizaci6n depende, en cierto grado, de 
la capacidad del examinador. Incluso la mejor 
prueba puede resultar inutil en manos de un 
evaluador dcscuidado. con entrenamiento de- 
ficiente o mal informado, como descubriri el 
lector en el tema 2B, Proceso de aplicacidn. 
Sin embargo, la mayorfa de los examinadores 
son competentes. Por tanto, la estandarizacidn 
depende en gran medida de las disposiciones 
de aplicacidn que se encuentran en el manual de 
instrucciones que por lo comun acompana a una 
prueba. 

La formulacidn de las instrucciones es un 
paso esencial pare la estandarizacidn de una 
prueba. A fin de garantizar procedimientos uni¬ 
formes de aplicacidn, quien desarrolla una prue¬ 
ba debe proporcionar matcriales cstfmulo 
comparables pare todos los examinados, debe 
espccificar con una precisidn considerable las 
instrucciones verbales para cada reactivo o 
subprueba y debe aconsejarle al examinador 
edmo ha de manejar una diversidad de dudas 
por parte de la persona evaluada. 

Para ilustrarestos puntos, considirense las 
diversas maneras en que una persona que desa¬ 
rrolla una prueba podrfa enfocar la evaluacidn 
dc la rctcncidn de dfgitos —el numero mixi- 
mo de dfgitos presentados verbalmente que un 
sujeto puede recordar de memoria. Podrfa ser 
que una prueba no estandarizada de retencion 
de dfgitos sugiriera tan sdlo que el examinador 
presentara de manera verbal series cada vez mis 
largas de numcros hasta que el sujeto fallare. 
El niimero de dfgitos en la serie mis larga re- 
cordada serfa, entonces, la capacidad de reten- 
cidn de dfgitos del sujeto. La mayorfa de los 


lectores puede darse cuenta de que una prueba 
con tal definicidn tan general careceri de uni- 
formidad de un examinador a otro. Si quien 
aplica la prueba esti en libertad de improvisar 
cualquier serie dc dfgitos, £qud podrfa impe- 
dirlc que presentara, con la inflexidn familiar 
de un locutor de television, “1-800-325-3535"? 
Tal serie serfa bastanlc mis ficil dc recordar 
que un conjunto mis aleatorio, por ejemplo, 
"7-2-8-1-9-4-6-3-7-4-2". La veiocidad de 
presentacidn tnmbien puede tener un efecto 
crucial sobre la uniformidad de una prueba de 
retencidn de dfgitos. Para propdsitos de es- 
tandarizacidn, es esencial que todos los exa¬ 
minadores presenten cada serie a una tasa 
constants, por ejemplo, un dfgito por segundo. 
Por ultimo, el examinador necesita saber edmo 
ha de reaccionar ante respucstas inesperadas. 
como el que un sujeto le diga: “^podrfa repetir- 
los de nuevo?” Por razones obvias, el conscjo 
habitual es “no”. 

Quien desarrolla una prueba puede inclu¬ 
so llegar hasta el punto de rccomcndar el com- 
portamiento deseado en el examinador, como 
mantener una expresidn facial neutra cuando 
se registra la respuesta de un sujeto. Estas in- 
fluencias aparentemente sutiles pueden tener un 
serio impacto sobre la uniformidad de los pro¬ 
cedimientos de prueba. Por ejemplo, un exa¬ 
minador que se sonrfe con displicencia cuando 
registra las respucstas podrfa provocar que el 
sujeto se sienta ansioso y falle en una tarea fi¬ 
cil. En el siguiente tema, cl Proceso de aplica¬ 
cidn, se analizari la influencia potencial del 
examinador sobre los rcsultados dc prueba. 

Una prueba psicoldgica tambiin es una 
muestra limitada de conducta. Ni el sujeto ni el 
examinador tienen el tiempo suficiente para una 
prueba realmente amplia, incluso cuando dsta 
se dirige a un dominio conductual bien defini- 
do y finito. Asf, las restricciones pricticas dic- 
tan que una prueba es sdlo una muestra de 
conducta. Sin embargo, la muestra de conduc¬ 
ta es de interds sdlo en la medida que permits 
que el examinador realice inferencias acerca del 
dominio total de conductas reiacionadas. Por 
ejemplo, el propdsitode una prueba de vocabula- 
rio consiste en determinar la reserva completa 
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de palabras de la persona examinada, al pcdir 
definiciones de una muestra muy pequeria, pero 
cuidadosamente scleccionada, de palabras. El 
hecho de que el sujeto pucda definir las 35 pa¬ 
labras particulares de una subprueba de voca- 
bulario (p. ej., en el WAIS-R) cs de poca 
consecuencia directa. Pero el significado de 
dichos resuhados es de gran importancia debi- 
do a quc senala el conocimiento general de vo- 
cabulario del individuo evaluado. 

Un punto intercsantc —del que cl ptiblico 
en general tiene poco conocimiento— es que 
los reactivos de prueba no necesitan parecerse 
a las conductas que la prueba intenta pronosti- 
car. La caracterfstica esencial de una buena 
prueba es que permita que el examinador pro- 
nostique otras conductas —no que refleje 
aqudllas a predecir. Si responder “cierto” a la 
afirmacidn “bebo mucha agua" ayuda a prede¬ 
cir la deprcsidn, entonces esta afirmacidn, en 
apariencia no relacionada, es un (ndice Util de 
la depresidn. Por tanto, el lector observarU que la 
prediccidn exitosa es una cuestidn empfnca que 
se resuelve a travds de la investigacidn apropia- 
da. Aunque la mayorfa de las pruebas toman 
una muestra directa del dominio de conductas 
que esperan predecir, 6ste no es un requisito 
psicomdtrico. 

Una prueba psicoldgica tambidn debe per- 
mitir la derivacidn de puntuaciones o catego- 
rfas. Thorndike (1918) expresd el axioma 
esencial de las pruebas en su famosa ascvera- 
cidn de que: “aquello que existe de alguna ma- 
nera, existe en cierta cantidad”. McCall (1939) 
fue un paso mUs alld al declarar: “cualquier cosa 
que existe en cierta cantidad, puede medirse”. 
Las pruebas sc esfuerzan en ser una forma de 
medicidn similar a los procedimientos de las 
ciencias ffsicas, donde los numeros represen- 
tan dimensiones abstractas como peso o tem- 
pcratura. Toda prueba suministra una o m&s 
puntuaciones o proporciona evidencia de que 
una persona pertenece a una categorfa y no a 
otra. En pocas palabras, las pruebas psicoldgi- 
cas resumcn la ejecucidn en numeros o clasifi- 
caciones. 

La suposicidn implfcita del punto de vista 
psicomdlrico es quc las pruebas midcn las dife- 


rencias individuates en cuanto a rasgos o ca- 
racteristicas que existen en cierto sentido vago 
de la palabra. En la mayor parte de los casos, 
se supone que todas las personas poseen el 
rasgo o caracterfstica medida. aunque en dife- 
rentes cantidades. El propdsitode la prueba con- 
siste en estimar la cantidad del rasgo o cualidad 
que posee un individuo. 

En este contexto, se deben hacer dos ad- 
vertencias. Primcro, toda puntuacidn de prue- 
ba siempre reflejard cierto grado de error de 
medicidn. La imprecisidn de las pruebas es sim- 
plemente inevitable: dstas deben depender de 
una muestra externa de conducta para estimar 
la caracterfstica no observable y, por tanto, in- 
ferida. Con frccuencia, los psicdmelras expre- 
san este punto fundamental con la ecuacidn: 

X = T+e 

donde X es la puntuacidn observada, Da pun- 
tuacidn vcrdadcra y e el componente de error 
positivo o negativo. Lo mejor que puede hacer 
quien desarrolla una prueba es procurar que e 
sea muy pequeno. Nunca se le puede eliminar 
por completo, como tampoco se puede saber 
su impacto exacto sobre el caso individual. El 
concepto de error de medicidn se analizard en 
el tema 3B, Conceptos de confiabilidad. 

La segunda advertcncia es que los con- 
sumidores de pruebas deben prevenirse de 
materializar las caracterfsticas medidas. Los re- 
sultados no representan una ‘‘cosa” quc tenga 
realidad ffsica; por lo comun, representan una 
abstraccidn que se ha demostrado que tiene uti- 
lidad para pronosticar conductas extemas a la 
prueba. Por ejemplo, cuando se analiza el Cl 
de una persona, los psicdlogos sc refieren a una 
abstraccidn que no tiene existencia directa, 
material, pero que, sin embargo, es util para 
pronosticar el rendimiento cscolar y otros re- 
sultados. 

Una prueba psicol6gica tambidn debe po- 
scer normas o estdndarcs. En general, la pun¬ 
tuacidn de prueba de una persona sc interprets 
al compararla con las puntuaciones obtenidas 
por otros individuos en la misma prueba. Para 
este propdsito, es comun que quienes desarrollan 
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prucbas aplican normas —un resumen de los 
resultados de prucba de un grupo grande y rc- 
prcscntativo de personas (Petersen, Kolcn y 
Hoover, 1989). El grupo normativo se conoce 
como muestra de estandarizacidn. 

La seleccidn y evaluacidn de la muestra 
de estandari/acidn es crucial para la utilidad de 
una prucba. Este grupo debe ser representative 
de la poblacidn a la que se dirige la prueba o, de 
olra manera, no serd posible determinar la po- 
sicidn relativa de un individuo examinado. En 
el caso extremo donde no se proporcionan nor¬ 
mas, el examinador no puede utilizar cn abso- 
luto los resultados de la prueba. Una excepcidn 
a este punto ocurre cn el caso de las pruebas 
referidas a criterio, las cuales sc analizan m£s 
adelante. 

Las normas no sdlo cstablecen un desem- 
peflo promedio, sino que tambidn sirven para 
indicar la frecuencia con la que se obtienen di- 
ferentes puntuaciones alias y bajas. Asf, las nor¬ 
mas permiten que el examinador determine el 
grado al que sc dcsvfa una puntuacidn con res- 
pecto a las expcctativas. Tal informacidn pue¬ 
de ser muy importante en la prediccidn de la 
conducta externa a la prueba del individuo exa¬ 
minado. Las normas tienen tal importancia tras- 
cendental en la intcrpretacidn de pmebas, que 
despuds se les considcrar.1 con amplitud en una 
seccidn independiente dentro de este texto. 

Por Ultimo, las prucbas no constituyen un 
fin cn s( mismas. En general, el propdsito ulti¬ 
mo de una prueba consiste en pronosticar con- 
ductas adicionalcs, diferentes de aquellas que 
sc muestrean de manera directa en la prueba. 
Asf, cl examinador puede tener mayor interds 
en las conductas extemas a la prueba pronosti- 
cadas por dsta que en las respuestas de pmeba 
en sf. Quizes un ejemplo concreto aclarard este 
punto. Supdngasc que un examinador aplica una 
piueba de manchas de tinta a un paciente en un 
hospital psiqui&trico y que el paciente respon- 
de a una mancha de tinta describidndola como 
“ojos que se asoman sigilosamente”. Con base 
en las normas establecidas, el examinador po- 
drfa pronosticar entonces que el sujeto es su- 
mamente suspicaz y obtcndrU poco beneficio 
de una psicoterapia individual. El propdsito de 


la prueba consiste en llegar a dsta y otras pre- 
dicciones similares —no determinar si la per¬ 
sona percibe ojos que lo miran fijamente desde 
las manchas. 

La capacidad de una prueba para pronosti¬ 
car conducta externa se determina por un am- 
plio cuerpo de invcstigacidn de validacidn, cuya 
mayorfa se realiza despuds de que se ha publi- 
cado la prueba, pero no hay ninguna garantfa 
cn el mundo de la investigacidn psicomdtrica. 
Es comdn que un investigador publique una 
prueba prometedora, sdlo para leer anos des¬ 
puds que otros investigadores la han encontra- 
do deficiente. £sta es una leccidn para quicnes 
emplean las prucbas: el hecho de que una pmeba 
exista y declare medir cierta caracterfstica, no 
es garantfa de que sea veraz en sus afirmacio- 
nes. Una pmeba puede tener un bonito tftulo, 
instmcciones precisas, normas elaboradas, em- 
paque atractivo y descubrimientos preliminarcs 
—pero si en cl estudio desapasionado por par¬ 
te de investigadores independientes, la pmeba 
no puede pronosticar conductas extemas apro- 
piadas, entonces es imitil. 


■ OTRAS DISTINCIONES 
EN PRUEBAS 


Las principales caracterfsticas de una pmeba, 
que se resumicron antes, se aplican en particu¬ 
lar a las referidas a la norma, que constituyen 
gran parte de las pruebas en uso. En una prue¬ 
ba referida a la norma, el desempefio de cada 
examinado se interpreta con referenda a una 
muestra de estandarizacidn relevante (Petersen, 
Kolen y Hoover, 1989). Sin embargo, estas ca¬ 
racterfsticas son menos importantes en cl caso 
especial de la prueba referida a criterio, dado 
que estos inslrumentos no necesitan de la com- 
paracion del individuo en particular con un gru¬ 
po de referenda. En este tipo de instrumento, 
cl objetivo consiste en determinar la posicidn 
de la persona evaluada con respecto a objeti- 
vos educativos definidos de manera muy estre- 
cha (Berk, 1984). Por ejemplo, una parte de una 
pmeba de aritmdica para nihos de 10 anos de 
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edad podrfa medir el nivel dc precisidn en la 
suma de pares de numeros de dos digitos. En 
una prueba sin lfmile de licmpo con 20 de di- 
chos problcmas, la precisidn serfa casi perfec- 
ta. Para este tipo de prueba, en realidad no 
importa como se compara al individuo exami- 
nado con olros de la misma edad, lo que importa 
es si el individuo satisface un criterio apropia- 
do y especffico —por ejcmplo, precisidn de 
95%. Debido a que no existe comparacidn con 
el desempeiio normativo de otros, este tipo de 
hcrramienta dc medicidn se ha llamado correc- 
tamente prueba referida a criterio, la cual, a di- 
ferencia de las pruebas referidas a la norma, 
puede intcrprctarse de manera significativa sin 
hacer refcrencia a normas. En el tema 3A, Nor¬ 
mas y cstandarizacidn, se analizardn con ma¬ 
yor detalle estas pruebas. 

Otra distincidn importante existe entre los 
tlrminos prueba y evaluacidn, que con frecuen- 
cia se consideran cqui valentes, sin embargo, no 
quieren decir exactamente lo mismo. Evalua- 
ci6n es un tdrmino m,ls amplio, que se rcfiere a 
todo cl proceso de recopilar informacidn sobre 
una persona y utilizarla para pronosticar la 
conducta. Puede definirse como la valoracidn 
o estimacidn de la magnitud de uno o mds atri- 
butos en una persona. La evaluacidn de las 
caracterfsticas humanas implica observaciones, 
entrevistas, listas de verificacidn, inventarios, 
pruebas proyectivas y otras pruebas psicoldgi- 
cas. En suma, las pruebas representan s61o una 
fuente de informacidn utilizada en el proceso 
de evaluacidn, en el cual el examinador debe 
comparar y combinar los datos de difcrentes 
fucntes. £ste es un proceso subjetivo de mane¬ 
ra inherente, que requiere que el examinador 
selcccione entre la informacidn conflictiva y 
realice predicciones con base en la gestalt com- 
pleta de datos. 

El tbrmino evaluacion sc invcntd durante 
la segunda Guerra Mundial para describir un 
programa dirigido a seleccionar hombrcs que 
destacaran en el servicio secreto, dentro de la 
Office of Strategic Services (OSS Assessment 
Staff, 1948). El personal de psicdlogos y psi- 
quiatras de la OSS amasaba una inmcnsa canti- 
dad de informacidn acerca de los candidatos 


durante cuatro agotadores dfas dc pruebas cs- 
critas, entrevistas y pruebas de personalidad. 
Ademas, el proceso de evaluacidn inclufa una 
variedad de pruebas sobre situaciones de la vida 
real que se basaban en la conciencia de que 
existe una diferencia entre saber hacer y poder 
hacer: 

... hicimos que los candidatos intentarbn, de he- 
cho, las tareas de manera ffsica o verbal, en vez 
de tan sbto indicar por escrito cdmo podrlan ha- 
cerse. Se nos imputsb a introducir pruebas rea- 
listas de la capacidad debido a descubrimientos 
como e< siguiente: los hombres que obtienen una 
alta puntuacibn en Comprensibn Mecbnlca, 
una prueba de lApiz y papel, pueden encontrar- 
se por debajo dot promedio cuando se trata de 
resolver problemas mecbntcos con sus manos 
(OSS Assessment Stall, 1948). 

Las pruebas situacionales inclufan tareas de 
grupo para transportar cquipo al otro lado de un 
arroyo y escalar una pared de 3 m dc altura, asf 
como el escrutinio individual de la capacidad 
para sobrevivir un interrogators realista y co- 
mandar a dos subordinados poco cooperatives 
en una tarea de construccidn. 

Con base en las observaciones conductua- 
les y en los resultados de prueba, el personal de 
la OSS calificaba a los candidatos en docenas 
de rasgos especfficos, en categorfas tan amplias 
como liderazgo, relaciones sociales, estabilidad 
emocional, inteligencia efectiva y capacidad 
ffsica. Estas calificaciones sirvieron para selec¬ 
cionar al personal militar de la OSS. 

HHtipos de pruebas 


Las pruebas pueden agruparse de manera am- 
plia en dos bandos: pruebas grupales y pruebas 
individuates. Las pruebas grupales son medi- 
das principalmente de ldpiz y papel, adecuadas 
para examinar a grandes grupos de personas a 
un mismo tiempo. Las pruebas indlviduales 
son instruments que. por su diseno y propo- 
sito, deben aplicarse a una sola persona. Una 
ventaja importante de estas ultimas es que el exa- 
minador puede estimar el nivel de motivaci6n 
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del sujeto y evaluar la relcvancia dc otros fac- 
lores (p. ej., impulsividad o ansiedad) sobre los 
resultados de prueba. 

Por conveniencia, las pruebas se clasifica- 
ran en ocho categories representadas en el cua- 
dro 2-1. Cada una dc ellas contiene pruebas 
referidas a la norma, referidas a crilerio, indi¬ 
vidual's y grupales. El lector observarA que 
cualquier tipologfa de las pruebas es una deter- 
minacibn puramente arbitraria. Porejemplo, po¬ 
drfa postularse incluso otra dicotomfa: pruebas 
que buscan medir el dcsempeno maxi mo (p. ej„ 
una prueba de inteligencia) contra las que buscan 
estimar una respuesta tfpica (p. ej., un inventa- 
rio de pcrsonalidad). 

En un sentido estricto, existen cientos —qui- 
iA miles— dc tipos diferentes de pruebas, cada 
una de las cuales mide un aspecto ligeramente 
diferentc del individuo. Por ejemplo, podrfa 
discutirse que incluso dos pruebas de inteli¬ 
gencia constituirfan diferentes tipos de medida. 
Una prueba podrfa revelar la suposicibn de 
que la inteligencia cs un constructo biolbgico que 
puedc medirse mejor a travds de las ondas cere- 
brales, mientras otra podrfa fundamentarsc en 
la perspectiva tradicional de que la inteligencia 


se exhibe en la capacidad para aprender ha- 
bilidadcs aculturadas como el vocabulario. 
Agrupar ambas medidas bajo la catcgorfa de 
pniebas de inteligencia es con toda seguri- 
dad una simplificacibn exagerada pero, sin em¬ 
bargo, es un punto de partida util. 

Como sc vio en el primer capftulo, las prue¬ 
bas de inteligencia se disenaron originalmen- 
te para tomar una muestra de un amplia variedad 
de habilidades, a fin de estimar el nivel intclcc- 
tual general del individuo. Las esealas Bind 
Simon tuvieron dxito, en parte, debido a que 
incorporaban (areas heterogdneas, incluyendo 
definiciones de palabras, memoria de disenos, 
preguntas dc comprcnsibn y tareas de visuali- 
zacibn espacial. Las pruebas grupales dc inteli¬ 
gencia que florecieron con tal profusion durante 
y despubs de la segunda Guerra Mundial tam- 
bidn median capacidades diversas —como lo 
demuestra la prueba Army Alfa con sus ocho 
secciones diferentes que miden juicio prActico, 
informacibn, aritmbtica y razonamiento, entie 
otras habilidades. 

Las pruebas modemas de inteligencia tam- 
bidn cmulan cste patrbn histbricamcntc esta- 
blecido al tomar una muestra dc una amplia 


Cuadro 2-1. Principales tipos de pruebas psicologicas 

Pruebas de inteligencia: miden la capacidad de un individuo en Areas relativamente globales como 
comprensibn verbal, organizacibn perceptual o razonamiento y, por tanto, ayudan a determinar el 
potencial para el trabajo escolar o para ciertas ocupaciones. 

Pruebas de aptitud: miden la capacidad para una (area o tipo de habilidad relativamente especfficas; 
en efecto, las pruebas de aptitud son una forma estrecha de prueba de capacidad. 

Pruebas de aprovechamiento: miden el grado de aprendizaje, Axito o logro de una persona en un 
tema o tarea. 

Pruebas de creatividad: evaluan el pensamiento novedoso y original y la capacidad para encontrar 
soluciones poco comunes o inesperadas, en especial, para problemas detinidos de manera vaga. 

Pruebas de personalidad: miden los rasgos, cualidades o conductas que determinan la Individualidad 
de una persona; dichas pruebas induyen listas de verificacibn, inventarios y tbcnicas proyectivas. 

Inventarios de intereses: miden la preferencia de un individuo por ciertas actividades o temas y, por 
tanto, ayudan a determinar la eleccibn de carrera. 

Procedimientos conductuales: describen de manera objetiva una conducta y estiman su frecuencia, 
identificando los antecedentes y consecuencias de la conducta. 

Pruebas neuropslcoldgicas: miden el desempeno cognoscitivo, sensorial, perceptual y motor para 
determinar el grado, localizacibn y consecuencias conductuales del dano cerebral. 
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variedad de dcstrczas consideradas importan¬ 
ces en nuestra cultura. En general, el tdrmino 
prueba de inteligencia se refiere a una prueba 
que produce una puntuacidn resumida general, 
basada en los rcsultados de una muestra he- 
terogdnea de reactivos. Por supuesto, una prue¬ 
ba de este tipo podrfa tambien proporcionar un 
perfil de las puntuaciones de subprueba, pero 
es la puntuacidn general la que en tdrminos 
generates atrae la mayor atcncidn. 

Una prueba de aptitud midc uno o mils 
segmentos claramcntc definidos y relati vamentc 
homogdneos de una capacidad; (iene dos va- 
riedades: pruebas de una sola aptitud y baterfas 
de prueba de aptitudes multiples. Como es ob- 
vio, las primeras cvaluan s61o una capacidad, 
mientras que las segundas proporcionan un 
perfil de puntuaciones para varias aptitudes. 

Con frecuencia, las pruebas de aptitud se 
emplean para pronosticar cl dxitocn una profe- 
sidn, curso de entrenamiento o esfuerzos edu- 
cativos. Por ejemplo, las Medidas Seashore de 
Talentos Musicales (Seashore, 1938), una se- 
rie de pruebas que cubrcn tono, sonoridad, rit- 
mo, tiempo, timbre y memoria tonal, pueden 
utilizarse para identificar a ninos que tienen un 
talento potcncial para la musica. Tambien exis- 
ten pruebas de aptitudes especializadas para la 
evaluacidn de habilidades en trabajo de ofici- 
na, capacidadcs mccdnicas, destreza manual y 
capacidad artfstica. £stas se revisan en el tema 
8A, Pruebas de aptitud y andlisis factorial. 

El uso miis comun para las pruebas de ap¬ 
titud consistc en determinar las admisiones a la 
universidad. La mayorfa de los estudiantes uni- 
versitarios cstiin familiarizados con el SAT (del 
ingl£s Scholastic Assessment Tesf, Prueba de 
Evaluacidn Escolar, antes llamada Scholastic 
Aptitude Tesf, Prueba de Aptitud Escolar) del 
Comitl de Examen de Ingreso a la Universi¬ 
dad. Esta prueba contiene una seccidn Verbal, 
que destaca el conocimiento de palabras y la 
comprensidn de lecture, y una seccidn de Ma- 
tematicas, que destaca el dlgebra, la geometrfa 
y el razonamiento perspicaz. En efecto, las uni- 
versidades que requieren con fines de admisidn 
ciertas puntuaciones mfnimas en el SAT. utili- 
zan la prueba para pronosticar el dxito acadd- 
mico. 


Las pruebas de aprovechamiento miden 
cl grado de aprendizaje, dxito o logro de una 
persona en una materia. La suposicidn implfci- 
ta de la mayor parte de estas pruebas es que las 
escuelas ban ensenado la materia de manera 
directa. Por tanto, el propdsito de la prueba con¬ 
sistc en determinar la cantidad del material que 
el sujeto ha absorbido o dominado. En general, 
las pruebas de aprovechamiento tienen varias 
subpruebas; por ejemplo, lecture, matemdticas, 
lenguaje, ciencias naturales y ciencias socialcs, 
las cuales se revisan en el tema 8B, Pruebas 
grupalcs dc aprovechamiento. 

La distincidn entre pruebas de aptitud y de 
aprovechamiento es m£s una cuestidn de uso 
que de contenido (Gregory, 1994a). De hecho, 
cualquier prueba puede scr dc aptitud, en el 
sentido de que ayuda a pronosticar el desempe- 
no future. De la misma manera, cualquier prue¬ 
ba puede ser de aprovechamiento, en el sentido 
de que reflcja cu&nto ha aprendido el sujeto. 
Por tanto, en la pr&ctica, la distincidn entre es- 
tos dos tipos de instrumentos sc determina por 
sus respectivos usos. En ciertas ocasiones, un 
instrumento puede servir para ambos propdsi- 
tos, actuando como una prueba de aptitud para 
predecir el dcsempefio future, y como prueba 
de aprovechamiento, para supervisar el apren¬ 
dizaje pasado. 

Las pruebas de creatividad cvaluan la 
capacidad del sujeto para producir nuevas ideas, 
discemimientos o creacioncs artfsticas que se 
consideran de valor social, estllico o cientffi- 
co. Asf, las medidas de creatividad enfatizan 
la novedad y originalidad en la solucidn de pro- 
blemas confusos o en la produccidn de obras 
artfsticas. En la figure 2-1 se ilustra una res- 
puesta creativa a un problema. 

Las pruebas de creatividad tienen una his- 
toria accidentada. En el decenio de 1960 se les 
promocionaba como una altemativa util para 
las pruebas de inteligencia y se les utilizd am- 
pliamente en los sistemas educativos de EUA. 
Los educadores se mostraron especialmente 
impresionados de que las pruebas de creativi¬ 
dad requirieran del pensamiento divergentc 
—empleando una variedad de respuestas para 
un problema complejo o confuso— en oposicidn 
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Flgura 2-1. Solucfones para el probtema de nueve pun- 
los oomo ejemplos de creatlvldad. 


al pensamiento convergente —encontrando 
una solucidn correcta unica para un problema 
bicn deftnido. Por ejemplo, una prueba de crea- 
tividad podrfa pedirle al individuo examinado 
que imaginara todas las cosas que sucederfan 
si las nubes tuvieran cuerdas que colgaran de 
ellas hasta el piso (Guilford, 1954). Se suponfa 
que los alumnos que pudieran dar un gran nu- 
mero de consecuencias eran mfis creativos que 
sus companeros menos imaginativos. Sin em¬ 
bargo, algunos psiedmetras se mostraron esedp- 
ticos, concluycndo que la creatividad es sdlo 
otra etiqueta para la inteligencia aplicada (p. 
ej., McNemar, 1964). 

Las pruebas de personalidad miden los 
rasgos, cualidadcs o conductas que determinan 
la individualidad de una persona; esta informa- 
ci6n ayuda a pronosticar la conducta. Estas 
pruebas pueden encontrarse en muchas varie- 
dades diferentes, incluyendo listas de verifica- 
ci6n, inventarios y tdcnicas proyectivas como 


frases incompletas y nianchas de tinta (cua- 
dro 2-2). 

Los inventarios de intereses miden la pre- 
ferencia de un individuo por cicrtas activida- 
des o temas y, con ello, ayudan a determinar la 
eleccidn de carrera; se basan en la suposicidn 
explfcita de que los patrones de interds deter¬ 
minan y, por tanto, tambidn predicen la satis- 
faccidn con el (rabajo. Por ejemplo, si la persona 
examinada tiene los mismos intereses que los 
contadores exitosos y satisfcchos, sc considera 
probable que disfrutard del trabajo de un con- 
tador. La suposicidn de que los patrones de in¬ 
terns pronostican la satisfaccidn con el trabajo 
se confirma en gran medida a travds de cstu- 
dios empfricos, como se revisard en el tema 
12A, Evaluation de intereses y valores labora- 
les. 

Existen muchos tipos de procedimicntos 
conductuales para evaluar los antcccdcntes y 
consecuencias de la conducta, incluyendo lis¬ 
tas de verificaciOn, escalas de clasificacidn, 
entrevistas y observaciones estructuradas. Es- 
tos mdtodos comparten una suposicidn comun 
de que la conducta puede comprendcrsc mejor 
en tdrminos de caracterfsticas definidas de 
manera clara como frecuencia, duration, ante- 
cedentes y consecuencias. Los procedimientos 
conductuales tienden a ser sumamente prag- 
mdticos en el sentido de que generalmente se 
encuentran entretejidos con enfoques de trata- 
micnlo. 

Las pruebas neuropsicologicas se utilizan 
para la evaluacidn de personas de las que se 
sospccha o se sabe que tienen una disfuncidn 
cerebral. La ncuropsicologia es cl cstudio de 
las relaciones cerebro-conducta. A travds de los 
anos, los neuropsicdlogos han descubierto que 
ciertas pruebas y procedimientos son muy sen- 
sibles a los efectos del dano cerebral, y emplean 
estas pruebas y procedimientos especializados 
para hacer inferencias acerca de la localizacidn, 
grado y consecuencias de dicho dado. 

Aunque las pruebas y procedimientos 
neuropsicoldgicos son utiles para liegar a un 
diagnOstico neuroldgico, su principal propdsito 
consiste en valorar las fortalczas y debilidades 
sensoriales, motoras, cognitivas y conductuales 
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Cuadro 2-2. Ejemplos de reactivos en una prueba 
de personalidad 

(a) Lista de verificacidn de adjetivos: 

palabras que lo describen: 

( ) asertivo 
( ) curioso 
( ) ecuanlme 
( ) esceptico 
( ) impulsivo 
( ) ansioso 

(b) Inventario de Falso-Verdadero: 

Encierre en un cfrculo la verdad o falsedad de cada afirmacion, segun se aplique 
a usted: 

V F Me gustan las revistas de deportes. 

V F La mayoria de las personas mentirlan para obtener un trabajo. 

V F Me gustan las grandes fiestas donde hay mucha diversibn. 

V F Pensamientos extranos me poseen durante horas a la vez. 

V F Con frecuencia me arrepiento de las oportunidades que perdi en la vida. 

V F En ocasiones me siento ansioso sin razbn alguna. 

V F Me agradan todas las personas que he conocido. 

V F Ouedarme dormido es un problems que me ocurre en raras ocasiones. 

(c) Prueba proyectiva de frases incompletas: 

Termine cada oracion con el primer pensamiento que le venga a la mente: 

Me siento aburrido cuando. 

Lo que mbs necesito es. 

Me agradan las personas que. 

Mi madre era. 


Marque aquellas 
( ) relajado 
( ) atento 
( ) alegre 
( ) impaciente 
( ) taciturno 
( ) optimista 


de un paciente con altcracibn neurolbgica.* La 
evaluacibn de fortalezas y debilidades en estos 
pacicntes cs crucial para documentar la me- 
jorfa, proyectar el grado de deterioro en los 
padecimientos degenerativos y planificar trata- 


mientos efectivos para incapacidadcs cspccffi- 
cas. Una evaluacibn neurologica completa re- 
quiere por lo comun dc 3 a 8 horas de prucbas 
individuates con una amplia baterfa de me- 
didas. Los examinadores deben haber atravesado 


* Las tlcnicas radioldgicas avanzadas como la Tomograffa Computanzada (TC), las Im&gcncs por Rcsonancia Magndtica 
(IRM) y la Tomograffa con Emisidn de Positrones (TEP) pcrmiten ahora que los ncurdlogos rcalicen inferencias 
sumamente prccisas accrca dc la prcscncia. localizaci6n y causas del dano cerebral. Sin embargo, cslo no reduce la 
importancia dc las prucbas ncuropsicoldgicas en la dclcrminacidn de las consecuencias fundonales del dado cerebral 
en la vida del paciente individual. 
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por un amplio enlrenanruento a vanzudo, a fin de 
comprender la gran cantidad de datos resultan¬ 
ts de las pruebas. En el tema 9B, Evaluacidn 
neuropsicoldgica y geriatrica, se revisaran las 
pruebas individuates y las principalcs batcrfas 
de prueba. 

Husos DE LAS PRUEBAS 


En tdrminos generates, el empleo mils comun 
de las pruebas psicoldgicas consiste en tomar 
decisiones acerca de las personas. Por ejemplo, 
las inslituciones educativas utilizan con frecuen- 
cia las pruebas para detcrminar los niveles de 
asignacidn para los alumnos y las universida- 
des evaluan a quidn dcben admitir, basadas par- 
cialmcnte en las puntuacioncs de prueba. Los 
sistcmas del servicio publico estatales, federa¬ 
tes y locales lambidn dcpcnden, en gran medi- 
da, de las pruebas para propdsitos de seleccidn 
de personal. 

Incluso el profesional independientc utili¬ 
ze principalmcntc las pruebas para la toma de 
decisiones. Los ejemplos incluycn al psicdlo- 
go consultor que emplea una prueba de perso- 
nalidad para detcrminar si un departamento de 
policia contrata a un candidato y no a otro y al 
neuropsicdlogo que emplea pruebas para con- 
cluir que un cliente ha sufrido dano cerebral. 

Pero la simple toma de decisiones no es la 
unica funcidn de las pruebas psicoldgicas. Es con- 
venientc distinguir cinco usos de las pruebas: 

• Clasificacidn. 

• Diagndstico y planificacidn del tratamiento. 

• Autoconocimiento. 

• Valoracidn de programas. 

• Investigacidn. 

Con frecuencia, estas aplicaciones se traslapan 
y, en ciertas ocasiones, es dificil distinguir unas 
de otras. Por ejemplo, una prueba que ayuda a 
determinar un diagndstico psiquidtrico podria 
tambidn proporcionar una forma de autocono¬ 
cimiento. Se analizardn con mayor detalle estas 
aplicaciones. 


El tdrmino clasificacidn cngloba una va- 
riedad de procedimientos que comparten un 
propdsito comun: asignar a una persona a una 
categorfa en vez de a otra. Por supuesto, la 
asignacidn de categories no es un fin en si mis- 
mo, sino la base para un tratamiento diferencial 
de algun tipo. Asf, la clasificacidn puede tener 
imporiantes efectos, como conceder o restrin- 
gir el acceso a una universidad especifica o 
determinar si se contrata a una persona para un 
trabajo en particular. Existen muchas y varia- 
das formas de clasificacidn, cada una de las 
cuales enfatiza un propdsito particular en la 
asignacidn de personas a categories. Se distin- 
guird entre asignacidn, deteccidn, certificacidn 
y scleccidn. 

La asignacidn es la distribucidn de perso¬ 
nas en los diferentes programas apropiados para 
sus necesidades o habilidades. Por ejemplo, con 
frecuencia las universidades utilizan un examcn 
de asignacidn en matemtiticas para determinar 
si los estudiantes deberfan inscribirsc a clascs de 
cdlculo, dlgebra o a un curso de regularizacidn. 

La deteccidn se reftere a las pruebas o 
procedimientos rdpidos y sencillos para idenli- 
ficar personas que podrian tener caracterfsticas 
o necesidades especiales. Por lo comun, los psi- 
edmetras reconocen que las pruebas de detec¬ 
cidn dardn por rcsultado muchas clasiftcaciones 
errdneas. Por tanto, se aconseja a los examina- 
dorcs que realicen pruebas de seguimiento con 
instrumentos adicionales, antes de tomar deci¬ 
siones importantes con base en pruebas de de¬ 
teccidn. Por ejemplo, para idcntificar a nifios 
con un talento sumamente excepcional en pen- 
samiento cspacial, un psiediogo podria aplicar 
una prueba dc Idpiz y papel con una duracidn 
de 10 minutos, a todos los nifios dentro de un 
sistema escolar. Despuds podria seleccionarsc 
a los estudiantes cuyas puntuaciones se encon- 
traran en el 10% superior, a fin de aplicarles 
una prueba m^s amplia. 

La certificacidn y la scleccidn tienen 
ambas una cualidad de aprobado/reprobado. 
Aprobar un examen de certificacidn confrere 
privilegios. Algunos ejemplos incluyen el de- 
recho de practicar la psicologia o dc conducir 
un automdvil. Asf, por lo comun, la certificacidn 
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implica que una persona tiene cuando menos 
una destreza minima en alguna disciplina o 
actividad. La selcccidn es similar a la certifica- 
cidn cn cuanto a que confiere privilegios, como 
la oportunidad de asistir a una universidad u 
obtener un empleo. 

Otro uso de las pruebas psicoldgicas es el 
diagndstico y la planificacidn de tratamiento. 
El diagndstico consiste en dos (areas entrela- 
zadas: determinar la naturalcza y la fuente de 
la conducta anormal de una persona y clasifi- 
car el patrdn de conducta dentro del sistema 
diagndstico aceptado. Por lo general, el diag¬ 
ndstico es precursor del remedioodel tratamien¬ 
to de distrds personal o ejecucidn deficiente. 

Con frecuencia, las pruebas psicoldgicas 
desempenan una funcidn importante en el diag¬ 
ndstico y la planificacidn del tratamiento. Por 
ejemplo, las pruebas de inteligencia son abso- 
lutamente esenciales en el diagn6stico del re- 
traso mental. Las pruebas de personalidad son 
utiles para diagnosticar la naturaleza y grado 
de los trastomos cmocionalcs. De hccho, algu- 
nas pruebas, como el MMPI, se discftaron con 
el propdsito explfcito de aumentar la eflcacia 
del diagndstico psiquidtrico. 

El diagndstico debcrfa ser mds que una 
mera clasificacidn, mis que la asignacidn de 
una etiqueta. Un diagndstico apropiado trans¬ 
mite informacidn —sobre fortalezas, debilidades, 
etiologia y mejores opciones de regularizacidn/ 
tratamiento. Saber que un nino ha recibido un 
diagndstico de discapacidad para el aprendi- 
zaje es inutil en tdrminos generales; pero saber 
ademis que el mismo nino se encuentra cn un 
nivel muy inferior cn cuanto a comprcnsidn de 
Icctura. se distrae con facilidad y necesita ayu- 
da con la fondtica basica. puede proporcionar 
una base indispensable para la planificacidn del 
tratamiento. 

Las pruebas psicoldgicas tambidn pucden 
proporcionar una poderosa fuente de autoco- 
nocimicnto. En algunos casos, la retroalimen- 
tacidn que recibe una persona de una prueba 
psicoldgica puede cambiar su profesidn o alte- 
rar el curso de su vida. Por supuesto, no todas 
las situaciones de prueba psicoldgica propor- 
cionan un autoconocimiento. Quizds en la ma¬ 


yor parte de los casos el cliente ya sabe lo que 
revelarin los resultados de prueba. Un estudian- 
te universitariocon un alto funcionamiento, po- 
cas veces se sorprende de descubrir que su Cl 
se encuentra en el rango superior. Una arqui- 
tecta no se dcsconcierta al cscuchar que tiene 
excelentes habilidades de razonamicnto cspa- 
cial. Un estudiante con una limitada capacidad 
para la lectura, por lo general no se asombra de 
recibir un diagndstico de “discapacidad para el 
aprendizaje". 

Otro empleo de las pruebas psicoldgicas 
es la valoracidn de programas cducativos y so- 
ciales. Se dird mis al respecto de la evaluacidn 
de programas cducativos cuando se analicen las 
pruebas de aprovechamiento en un capftulo 
posterior. Aquf nos limitaremos en el uso de 
las pruebas para la evaluacidn de programas 
sociales, los cuales se disenan para proporcio¬ 
nar servicios que mejoren las condiciones so¬ 
ciales y la vida comunitaria. Por ejemplo, cl 
Proyecto Head Start es un programa con fon- 
dos federates que apoya a nivel nacional los 
proyectos de ensenanza preescolar para niftos 
de sectores desprotegidos (Cicerclli, 1969; 
McKey y colaboradores, 1985). Lanzado cn 
1965 como un intento que sentara precedentes 
en cuanto a proporcionar programas de desa- 
rrollo infantil a familias de bajos ingresos, cl 
Head Stan ha suministrado enriquecimiento 
educativo y servicios de salud a millones de 
preescolares en sectores de alto riesgo. 

Pero, exactamente, ^qud impacto tiene el 
programa multimillonario Head Start sobre 
el desarrollo en la temprana infancia? El Con- 
greso de EUA deseaba saber si el programa mc- 
joraba el desempeno escolar y reducia el fracaso 
en la escuela de los nihos inscritos. Pero los 
centres varfan segun las institucioncs patroci- 
nadoras, las caracterfsticas del personal, la co- 
bertura, el contenido y los objetivos, de modo 
que los efectos son diffciles de evaluar. Las 
pruebas psicoldgicas proporcionan una base 
objetiva para responder a estas preguntas, la 
cual es muy superior a los informes aneedd- 
ticos o impresionistas. En general, los nihos 
participantes en Head Stan muestran mejorfas 
inmediatas cn Cl, preparacidn para la escuela 
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y aprovechamiento acaddmico, pero cstas 
jnejorfas se disipan en los siguientes afios (fi- 
gura 2-2). 

Hasta cste punto se han analizado las apli- 
caciones prdcticas de las pruebas psicoldgicas 
a problcmas cotidianos, como la seleccidn de 
personal, el diagndslico o la cvaluacidn de pro- 
gramas. En cada uno dc cstos casos, las prue¬ 
bas salisfacen un propdsito inmediato, de 
naturaleza prdctica: ayudar al examinador a to- 
mar dccisiones sobre personas o programas. 
Pero las pruebas tambidn representan una fun- 
ci6n impoilante en las ramas aplicada y tedrica 
de la invcstigacidn conductual. Como ejcmplo de 
las pruebas en la invcstigacidn aplicada, con- 
siddrese el problema que enfrentan los neuro- 
psicdlogos que desean investigar la hipdtesis 
de que la absorcidn de plomo a bajo nivel cau¬ 
sa deficiencias conductuales en los nifios. La 
unica manera faclible de explorar esta suposi- 
cidn es sometiendo a prueba a nifios normales 
y con exposicidn al plomo con una baterta de 
pruebas psicoldgicas. Needleman, Gunnoe, 
Leviton, Reed, Peresie, Maher y Barrett (1979) 
utilizaron un conjunto de pruebas tradicionalcs 
e innovadoras para concluir que la absorcidn 
dc plomo a bajo nivel causa disminuciones en 
el Cl. altcraciones en el tiempo dc reaccidn y 
aumentos progresivos de conducta indeseable 
en el saldn de clase. Sus conclusiones inspira- 



Hgura 2-2. Resultados de pruebas longrtudinales del 
Proyecto Head Start. 

Puente: De McKey, R. H. y otros (1985). The impact 
of Head Start on children, families and communities. 
Washington, DC:U.S. Government Printing Office. Do- 
mink> Publico. 


ron un tumultuoso y amargo intercambio dc 
opiniones que no sc revisardn aquf (Needleman, 
y colaboradores, 1990). Sin embargo, las pa- 
siones inspiradas por estc cstudio son la per- 
sonificacidn de una cuesLidn importante: los 
acaddmicos y las personas que crean la polftica 
publica respetan las pruebas psicoldgicas. ^Por 
qud si no habr(an de participar en largos y en- 
conados debates acerca de la validez dc los des- 
cubrimientos de investigacidn basados en 
pruebas? 

En ciertas ocasiones, las pruebas satisfa- 
cen un papel menos mundano al ayudar a los 
cientiTicos a investigar cuestiones tcdricas que 
no tienen aplicaciones practicas inmediatas u 
obvias. Por ejcmplo, para analizar la dependen- 
cia del campo perceptual, Wilkin (1949) inventd 
las pruebas de la habitacidn inclinada y de la 
silla inclinada (HISI). El aparato para estas prue¬ 
bas consiste en una habitacidn tipo caja, sus- 
pendida dc pivotes con balines, de modo que 
pueda inclinarse en cualquier grado hacia la 
izquierda o derecha. Dentro de la habitacidn 
hay una silla para el sujeto, la cual tambidn pue- 
de inclinarse con independencia dc la habita¬ 
cidn. La tarea del sujeto es llevar su cuerpo a 
una posicidn que se perciba como recta. Los 
sujetos que dependen del campo alinean de cier- 
to modo sus cuerpos con respecto a la habita¬ 
cidn, en vez de basarse en la fuerza de gravedad 
percibida. Los sujetos independientes del cam¬ 
po se ven menos afectados por la habitacidn 
mal alineada y estan mas a tono con sus sefia- 
les pcrceptualcs intemas; es decir, sus juicios 
perceptuales son rclativamente independientes 
de la informacidn visual distorsionada. La HISI 
inspird toda una vida de investigacioncs acerca 
del dcsarrollo de la personalidad, pero en raras 
ocasiones se aplied a algun problema prdctico 
de prueba. 


R quiIn puede obtener las 

PRUEBAS 


Por lo general, aquellos que desarrollan las prue¬ 
bas, los editores y los examinadores en psico- 
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logfa proporcionan las pruebas psicolbgicas s61o 
a personas califtcadas que tengan una nccesi- 
dad legftima de estudiar o utilizar estos matc- 
riales. Existen tres razones por las que se 
reslringc el acceso a las pruebas psicolbgicas: 

1. En manos de personas no calificadas, puc- 
den causar dano. 

2. El procesode seleccibn resulta invdlido para 
personas que pueden adelantarsc a las pre- 
guntas de la prueba. 

3. La filtracibn del contenido del reactivo al 
publico en general deslruye la eficacia de la 
prueba. 

Se analizarbn con mbs dctallc cada uno de es¬ 
tos puntos. 

Un examinador no calificado puede come¬ 
ter errores en la seleccibn, aplicacibn, calificacibn 
o interpretacibn de las pruebas psicolbgicas, lo 
cual puede dafiar al sujeto. Las posibilidades 
de error y dafio son siempre ilimitadas. de modo 
que aquf sblo se proporcionarb un ejemplo. Un 
error comun entre los examinadores sin expe- 
riencia consiste en no dar erbdito a una persona 
de mayor edad por los reactivos mbs facilcs, no 
aplicados, de una subescala. Por ejemplo, en 
una subescala hipotbtica de inteligcncia con 20 
reactivos, el manual de la prueba podria espe- 
cificar que a un individuo mayor sblo se le de- 
berfan aplicar los reactivos del 11 al 20, con la 
suposicibn de que los reactivos mbs fbciles (la 
10) seguramente sc contcstarbn de manera co- 
rrecta. Sin embargo, las instrucciones podrian 
cspecificar que el examinado deberfa recibir 
acrcditacibn en puntos por los reactivos 1 a 10. 
No agregar estos puntos producirfa que la pun- 
luacibn fuera drbsticamente baja, con conse- 
cuencias negativas para la persona examinada. 

Otra razdn para limitar la disponibilidad 
de las pruebas es que el acceso ilfeito a su con¬ 
tenido socava la efectividad del proceso de 
seleccibn. Dicho en tbrminos sencillos, los in- 
dividuos examinados que han tenido acceso pre- 
vio a una prueba de seleccibn pueden aprender 
a producir los resultados de prueba dcscados. 
Por ultimo, deberfa ser obvio que la filtracibn 
de los reactivos de prueba al publico produce 


que la prueba sea totalmente inutil. Si los indivi- 
duos pueden memorizar las respuestas a las 
preguntas de la prueba, su dcsempeno mejora- 
rb de manera artificial. Para dar un ejemplo 
extremo, una persona invidente podrfa aprobar 
una prueba de visibn del color a travbs de me¬ 
morizar las respuestas correctas. 

7 j FUENTES DE INFORMAClbN 
H SOBRE PRUEBAS 


Un libro de texto sobre pruebas psicoldgicas 
no puede analizar todos los instrumentos que 
tengan un interns potcncial para los lectores. 
jSimplcmentc hay demasiadas pruebas! Lo que 
es mis, cada ano se desarrollan docenas de prue¬ 
bas nuevas y utiles. El estudiante serio de las 
pruebas psicoldgicas nccesitartf pautas y estra- 
tegias para aprender sobre dichos mdtodos, no 
una lista estdtica de recomendaciones. 

La informacidn sobre pruebas psicoldgicas 
puede obtenerse de cuatro fuentes: libros de 
referencia, catdlogos editoriales, revistas y ma- 
nuales de prueba. Se citardn unos cuantos ejem- 
plos destacados de cada categorfa, pero se 
espera que el lector asimile una cstrategia para 
adquirir conocimicntos, en vez de depender en 
forma exclusiva de estas citas especfficas. 

La mejor fuente de referencia en cuanto a 
informacidn sobre las pruebas establecidas es 
el Mental Measurements Yearbook (MMY), que 
publica el Bums Institutefor Mental Measurement, 
en la University of Nebraska. Pcriddicamcnte 
se publica una nueva edicibn del MMY (Buros, 
1978; Conoley e Impara, 1995; Conoley y Kramer, 
1989, 1992; Mitchell, 1985). El MMY incluyc 
resenas crfticas de las pruebas y una lista de re- 
ferencias importantes. 

La Test Corporation of America publica 
varios libros de referencia y crfticas excelentes 
sobre pruebas. Tests, editado por Sweetland y 
Keyser (1987), es una lista amplia de instru¬ 
mentos de evaluacibn en psicologfa, cducacibn 
y empresas. Test Critiques (volumenes I—VI). 
editado por Keyser y Sweerland (1984—1988), 
proporciona evaluaciones a profundidad de las 




prucbas psicoldgicas, cducativas e industriales. 
Ademds, cl mismo editor ofrece una serie de 
libros sobre prucbas con nifios, adolescentes, 
adultos y personas dc edad avanzada (Weaver, 
1984; Harrington, 1986; Swicrcinsky, 1985). 
Otra excelente fuente de medidas clfnicas 
cortas y scncillas es Measures for Clinical 
Practice: A Sourcebook, de Corcoran y Fisher 
(1994). En cste compendio, se proporcionan 
referencias cruzadas de instrumentos para adul¬ 
tos, nifios, parejas y familias, segun sea el Srea 
problemitica. 

Otra manera de conocer las pruebas es pe- 
dir los catalogos de los principalcs editores de 
pruebas. El Apdndice B (Dirccciones de Edito- 
riales de Pruebas) lista los nombres y direccio- 
nes de las editoriales y distribuidorcs de pruebas 
mAs destacados en Estados Unidos. El Ap6ndi- 
ce C (Principales Pruebas y sus Editores) pro- 
porciona una lista categorizada de pruebas 
notables y dc las editoriales que las publican. 
El ultimo MMY contiene un directorio mils am- 
plio dc editoriales y pruebas. 

Muchas revistas psicoldgicas publican ar- 
tfculos sobre la confiabilidad y validez de las 
prucbas m£s conocidas. La mejor manera dc 
localizar los estudios sobre una prueba espeef- 
fica es a travds de los Psychological Abstracts, 
un destacado compendio mensual de las prin- 

EIresumen 


1. Una prueba puede definirse como un proce- 
dimiento estandarizado para tomar una 
muestra de conducta y describirla con cate- 
gorfas y puntuacioncs. Ademis, la mayorfa 
de las pruebas tienen normas o est&ndares 
con base en los cuales pueden utilizarse los 
resultados para pronosticar otras conductas 
m£s importantes. 

2. Las pruebas siempre constituycn una mues¬ 
tra de la conducta, nunca la totalidad dc 
aquello que cl examinador busca medir. Por 
tal razon, los resultados de prueba siempre 
incorporan cierto grado de error dc medi- 
ci6n. 
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cipales revistas en psicologfa y campos rela- 
cionados. En general, las principales bibliote- 
cas tienen un PsychLit en CD-ROM. lista es la 
versidn para computadora de los Psychological 
Abstracts. Si el lector sdlo estd interesado en 
examinar los estudios recientes sobre pruebas 
psicoldgicas, serfa adecuado consultar los ulti- 
mos numeros de las siguientes revistas: 

Assessment 

Advances in Personality Assessment 
The Journal of Psychoeducational Assess¬ 
ment 

Psychology in Schools 
The Journal of School Psychology 
Educational and Psychological Measu¬ 
rement 

Psychological Assessment 
The Journal of Clinical Neuropsychology 
The Journal of Clinical Psychology 
The Journal of Personality Assessment 

Por ultimo, una importante e ignorada fuente 
de informacidn sobre cualquier prueba espeef- 
fica es su manual. Un buen manual contiene 
informaci6n esencial sobre normas, estandari- 
zacidn, aplicacidn, confiabilidad y validez. 


3. En una prueba con referenda a la norma, la 
puntuacidn de prueba del individuo se in- 
terpreta en relacidn con las puntuaciones 
obtenidas por otras personas en la misma 
prueba. En'una prueba con referenda al 
criterio, el Infasis se coloca sobre aquello 
que la persona examinada puede hacer con 
respecto a criterios educativos definidos de 
manera estrecha. 

4. La evaluacidn es el proceso de recopilar 
informacidn sobre una persona y utilizar- 
la para hacer inferencias acerca de sus 
caracterfsticas o para predeeir su conducta. 
La evaluacidn incorpora las pruebas, pero 
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es mas amplia y puede incluir observaciones, 
entrevistas y otras fucntcs dc informacidn. 

5. Las pruebas grupales son medidas de Iripiz 
y papel adecuadas para examinar a grandes 
grupos de personas a un mismo ticmpo. Las 
pruebas individuates cstdn discfiadas para 
una aplicacidn a una sola persona; con ello, el 
examinador puede observar la rnotivacidn y 
otras caracterfsticas de la persona examinada. 

6. Una clasificacidn arbitraria, pero util, de las 
pruebas psicoldgicas es la siguiente: de inte- 
ligencia, aptitud, aprovechamiento, creati- 
vidad, personalidad, intereses, conductual y 
neuropsicoldgica. Las caracterfsticas de es- 
tas pruebas sc resumcn en el cuadro 2-1. 

7. Se pueden distinguir cinco usos de las prue¬ 
bas: clasificacidn, diagndstico y planifica- 
ci6n del tratamiento, autoconocimiento, va- 
loracidn de programas e investigacidn. 

8. La clasificacidn puede descomponersc aun 
mds en: asignacidn, que es la clasificacidn 


de personas a programas apropiados; dc- 
teccidn, que es la identificacidn rdpida dc 
personas con caracterfsticas o necesidades 
especiales; certiftcacidn (p.ej. para obtener 
una licencia de manejo) y selecci6n (p. ej., 
para una universidad). 

9. El acceso a las pruebas psicoldgicas estd 
controlado dc manera cstricta, de modo que 
sdlo las personas con el entrenamiento apro- 
piado puedan tener acceso a ellas. Muchos 
editores de pruebas las dividen en tres ni- 
veles dc complcjidad, las cuales requieren 
grados de pericia cada vez mayores para su 
aplicacidn. 

10. Las fucntcs dc informacidn sobre pruebas 
incluyen la serie del Mental Measurements 
Yearbook y los volumenes de las Test Criti¬ 
ques. Algunas revistas como Assessment y 
The Journal of Psychoeducational Assess¬ 
ment tambidn proporcionan informacidn 
sobre pruebas psicoldgicas. 
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psiedmetra 

p. 36 

pruebas de creatividad 

p. 42 

prueba 

p. 36 

crcatividad 

p. 42 

proccdi miento cstandarizado 

p. 37 

pruebas dc personalidad 

p. 43 

normas 

p. 39 

inventarios de intereses 

p. 43 

muestra de estandarizacidn 

p. 39 

procedimientos conductuales 

p. 43 

prueba referida a la norma 

p. 39 

pruebas neuropsicoldgicas 

p. 43 

prueba referida a criterio 

p. 39 

clasiflcacidn 

p. 45 

evaluacidn 

p. 40 

asignacidn 

p. 45 

pruebas grupales 

p. 40 

deteccidn 

p. 45 

pruebas individuales 

p. 40-41 

certificacidn 

p. 45 

pruebas de inteligencia 

p. 41 

diagndstico 

p. 46 

prueba de aptitud 

p. 42 

discapacidad para el 


pruebas de aprovechamiento 

p. 42 

aprendizaje 

p. 46 




Tema 2B 

Proceso de aplicacion 


Ejemplo de caso 2-1. Impacto de las pruebas no eslandarizadas 
Procedimientos estandarizados en la apl>caci6n de pruebas 
Procedimientos deseables en la aplicacibn de pruebas 
Influencia del examinador 

Antecedentes y motrvactbn de la persona examinada 

Aspectos sobre calif icacibn 

Resumen 

Tbrminos y conceplos clave 


~—~ v ’ 






Las pruebas psicolbgicas son un proce¬ 
so dinbmico bajo la influencia de muchos fac- 
tores. Aunque los cxaminadores se csfuerzan 
en garantizar que los resultados dc prucba re- 
flejcn de manera precisa los rasgos o capacida- 
des evaluados, pueden influir muchos factores 
extemos en cl rcsultado del examen psicolb- 
gico. En esta section sc revisard el impacto 
potcncialmente crucial de varias fuentes de in¬ 
fluencia: el modo de aplicacion, las caracterfs- 
ticas del examinador, el contexto de la prueba, 
la motivacibn y experiencia dc la persona exa¬ 
minada y el mbtodo de calificacibn. 

La scnsibilidad del proceso de prueba a 
las influencias extemas cs obvio en esos es- 


pcctdculos poco comuncs y atroccs de las 
pruebas no estandarizadas quc se presentan de 
vez en cuando (ejemplo de caso 2-1). Sin em¬ 
bargo, los resultados invdlidos de prueba no sc 
originan sblo dc fuentes obvias, como la apli¬ 
cacibn evidentemente no estandarizada, el 
examinador hostil, la habitacibn ruidosa de 
prueba, el individuo asustado o la califica¬ 
cibn descuidada. Ademds, existen numerosas 
y sutiles maneras en las que cl mbtodo, el exa¬ 
minador, el contexto, la motivacidn o la cali- 
ficacidn pueden alterar los resultados de 
prueba. Se proporciona un examen detallado 
de estas influencias extemas en lo que resta de 
este tcma. 
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I PROCEDIMIENTOS 

ESTANDARIZADOS EN LA 

aplicaci6n de pruebas 


La interpretacidn de una prueba psicoldgica es 
mis confiablc cuando las mediciones se obtic- 
nen bajo las condiciones estandarizadas dcscri- 
tas en el manual de prueba que publica su editor. 
Los procedimientos no estandarizados pucden 
alterar el significado de los resultados de la 
prueba, que pucden resultar invilidos y. por tan- 
to, cngaflosos. Los procedimientos estandari¬ 
zados son tan importantes que se enumeran 
como un criterio esencial para el examen vili- 
do en los Standards for Educational and 
Psychological Testing (1985.1999), un manual 
de referenda que publican de manera conjunta 
la American Psychological Association y otros 
grupos: 

En las apllcaciones tlpicas, quienes aplican una 
prueba deben segulr de manera cuidadosa los 
procedimientos estandarizados para la aplicacidn 
y calillcaclOn que especifica el editor de la prue¬ 
ba. Las especilicactones concernlentes a las 
Instrucciones para las personas examlnadas, 
llmltes de tlempo, forma de presentadbn o res- 
puesta del reactlvo y materlales o equipo de prue¬ 
ba deben observarse de manera estricta. SPIo 
deben hacerse oxcepciones con base en el jui- 
clo profesional consider ado de modo cuidadoso, 
princlpalmente en las apllcaciones clfnicas 
(AERA, APA, NCME, 1985) 

Supdngase que las instrucciones para la sec- 
ci6n de vocabulario de una prueba de inteli- 
gencia para ninos especifica que el examinador 
debe preguntar: “^qud signiftca la palabra di- 
vim, qu6 es un divin?” Si cl sujeto respondiera 
“nunca he escuchado esa palabra”, un exami¬ 
nador sin experiencia podrfa sentirse tentado a 
responder: ”ya sabes, un sofi —^qu6 es un 
soft?" Esto podrfa parecerle al lector como una 
forma inocente de juego limpio, un simple 
refraseo de la pregunta original. Sin embargo, 
al alejarsc de los procedimientos estandariza¬ 
dos, el examinador ha aplicado en realidad otra 
prueba. El punto de pedir la deftnicidn de di- 
vin (y no soft) es precisamcnte que divin es 
mis diffcil de definir y, por tanto, es un mejor 


fndice de habilidades de nivel superior en cuan- 
to a vocabulario. 

Aunque los procedimientos estandarizados 
de prueba son normalmente esenciales, existen 
casos en que es dcseable, o incluso neccsaria, 
la flexibilidad en los procedimientos. Como to 
sugieren las normas dc la APA, dichas desvia- 
cioncs deben ser razonadas y deliberadas. Aquf 
es pertinente realizar una analogfa enlre el es- 
pfritu y la letra de la ley. Un examinador dema- 
siado entusiasta podrfa captar, por un decir, la 
letra de la ley al adherirse de manera literal y 
estricta a los procedimientos de prueba expre- 
sados en el manual de edicidn. Pero, £en reali¬ 
dad dsta era la intencidn del editor? ^Siquicra 
es la manera en que, en realidad, se aplied la 
prueba a la muestra normativa? Es mis proba¬ 
ble que los editores preferirfan que los exami- 
nadores captaran el espfritu de la ley incluso si, 
en ocasiones, fuera necesario adaptar un tanto 
los procedimientos de la prueba. 

Considdrese la siguiente situacidn que sur- 
gid cuando un psicdlogo le aplied una prueba 
estandarizada de inteligencia a una estudiante 
universitaria ansiosa y demasiado concreta. 
Cuando se le preguntd: “^cuintos son cuatro 
ddlares mis cinco ddlares?”, la estudiante 
respondid: “cuatro ddlares son cuatro ddlares 
y cinco ddlares son cinco ddlares”. Una intcr- 
pretacidn literal del manual de prueba requeri- 
rfa que el examinador registrara un erddito de 
cero y prosiguiera con el siguiente reactivo. Sin 
embaigo, la pregunta tenfa el propdsito dc exa- 
minar las habilidades aritmdticas y no lo con- 
creto del pensamiento. Asf, el examinador hizo 
de nuevo la pregunta con un ligero cambio en 
cuanto a dnfasis: “^cuintos son cuatro ddlares 
y cinco ddlares?” La sujeto lanzd una fuerte 
carcajada y respondid dc inmediato "nueve 
ddlares —no me percatd de que era una pre¬ 
gunta de aritmdtica”. 

La necesidad de adaptar los procedimien¬ 
tos estandarizados para una prueba es particu- 
larmente evidente cuando se examine a personas 
con ciertos tipos de discapacidadcs. Se podrfa 
permitirque un individuocon una discapacidad 
del habla escribiera sus respucstas a pregun- 
tas presentadas de manera oral o que utilizara 
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EjEMPLO DE CASO 2-1 

IMPACTO DE LAS PRUEBAS NO ESTANDAR1ZADAS 

Un esludlante de posgrado en pslcologfa, con ol cabollo desculdado y crespo y barba completa. 
so acerca a una nifta do sols afios quo so encuenlra en la sala de espera y le sollcila quo lo slga. 
El esludlante de posgrado habla de manera brusca con un acento de Brooklln que es desconocido 
para la pequefia. £sla se muestra vlslblemonte atemortzada y permaneca senlada hasta que su 
madre la empujn para que se levanle, mientras le lanza la no muy tranquillzadora advortencia: 
"Apurate o tu papl se va a enojar mucho". Son la 8:30 de la noche y la nina acaba de termlnar con 
una baterla completa de pruebas mddicas. Tan sdlo una hora antes, una enfermera introdujo una 
enorme aguja en el brazo derecho de la nlRa y lo extrajo una cantldad de sangre equivalente a 
una jerlnga. De manera obedlento, pero con titubeos, la nlfia slgue at examlnador a una habilacibn 
apenas llumlnada. El constante ruldo del trdfleo en una via rdplda cercana le hace diflcil escuchar 
las Instrucclones del examlnador. £sle se encuentra cansado —como parte de un proyecto de 
Invesligacidn epldemloldglca de grandes proporciones, ha estado examlnando a nines desde 
las 7:30 de la mafiana. Sin embargo, le apllca la Escala Wechslor de Inteligencia para Ninos 
(WISC) a un paso acalorante, terminando la prueba en 26 mlnutos. Despuds, esa mlsma noche 
calilica la prueba en su habitackin de un motel. Por descuido, no le da erddito a la nifia por varlos 
reactivos simples y tambidn comete un error admlnlstrativo al sumar las puntuaciones estdndar. 
Se Inlorma que la nlfia tiene un Cl de 69 puntos, lo cual posiblemente indlca retraso mental lave. 
Por fortuna, al dla slgulonte ol supervisor de pruebas detecta los errores de callflcacldn y cuestlona 
al estudiante de posgrado sobre las condlciones de la prueba. Al reconocer que los resultados 
no son vdlidos, el supervisor vuelvo a apllcar la prueba un mes despuds bajo condlciones 
favorables; la pequefia obtiene puntuaciones mucho mds alias, dentro del rango promedio bajo. 
Al comparer ambos protocols de prueba, el examlnador de posgrado aprende una vallosa leocldn: 
las pruobas vdlidas son mds que una simple cuestldn de hacer preguntas, registrar respuestas y 
sumar las puntuaciones de un modo despreocupado. 


ademanes o pantomima como respuesta para 
algunos reactivos. Por ejcmplo, una pregunta 
de prueba podrfa ser: “iqud forma tiene una 
pelota?" La pregunta estd disenada para son- 
dear el conocimiento de la persona acerca de 
formas comunes, no para examinar si dsta pue- 
de verbalizar la palabra “redonda”. Escribir 
como respuesta la palabra redonda y dar una 
respuesta con ademanes (un movimiento cir¬ 
cular con el dedo fndice) son, tambidn, igual- 
mente correctas. 

Los ajustes menores a los procedimientos, 
que se adhieren al espfritu en el que se desarro- 
116 la prueba, ocurren de manera regular y no 
son causa de alarma. Estas adaptaciones meno¬ 
res no invalidan las normas establecidas —por 
el contrario, la adaptacidn apropiada de los pro¬ 


cedimientos es necesaria de modo que las nor¬ 
mas puedan continuar siendo vdlidas. Despuds 
de todo, los examinadores que recolectaron 
datos sobre la muestra de estandarizacidn no 
actuaron como autdmatas sin corazdn cuando 
presentaron las preguntas a los sujetos. Los 
examinadores que deseen obtener resultados 
vdlidos deben ejercer, del mismo modo, una fle- 
xibilidad razonada cn los procedimientos de 
prueba. 

Sin embargo, es neccsario tener una con¬ 
siderable experiencia clfnica para determinar si 
un ajuste en el proccdimiento es menor o tan sus- 
tancial que las normas existentes ya no pueden 
aplicarse. Esta es la razdn por la cual los exa¬ 
minadores en psicologfa pasan, por lo comun, 
por una extensa experiencia supervisada antes 
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dc que se les permita aplicar e interpretar prue- 
bas individuals de capacidad o dc personalidad. 

En ciertos casos, un examinador se alejarA 
a un grado considerable de los procedimientos 
estandarizados a sabiendas de lo que hace; esta 
pr&ctica impide el uso de las normas disponi- 
bles para la prueba. En estos casos, la prueba 
se utiliza para ayudar a formular juicios ch'nicos, 
m,1s que para determinar un fndice cuantitali- 
vo. Por ejemplo, cuando se examina a pacientes 
con afasia, podrfa scr deseable ignorar porcom- 
pleto los Ifmites de tiempo y aceptar las res- 
puestas indirectas (Eisenson, 1954). Incluso el 
examinador podrfa no calcular una puntuacidn. 
En estos casos poco comunes la prueba se vuel- 
ve, en efecto, un complemento de la entrevista 
clfnica. Por supuesto, cuando el examinador no 
se adhiere a los procedimientos estandarizados, 
ello deberfa especificarse de manera explfcita 
en el informe por escrito. 


■ PROCEDIMIENTOS DESEABLES 
EN LA APUCACldN DE PRUEBAS 


Se podrfa escribir un pequeno tratado acerca 
dc los procedimientos deseables en la aplica- 
cidn de pruebas, pero tendremos que confor- 
mamos con un breve listado de los puntos mds 
esenciales. Para mayores detalles, el lector in- 
teresado puede consultar a Sattler (1988) sobre 
pruebas individuates con ninos y a Clemans 
(1971) sobre pruebas grupales. Se analizardn 
primero las pruebas individuales y despuds se 
enumerardn de manera breve algunos puntos 
importantes acerca de los procedimientos de- 
scablcs en las pruebas con grupos. 

Un componente esencial de las pruebas 
individuales es que los examinadores deben 
familiarizarse fntimamente con los materiales 
e instruccioncs antes de comenzar con la apli- 
cacirin. En su mayorfa, esto implica extensos 
ensayos y anticipacidn de las circunstancias 
poco comunes y de la respuesta apropiada. Un 
examinador bien preparado tiene memorizados 
los elementos clave de las instrucciones verba- 
les y cst4 listo para manejar lo inesperado. 


Con frecuencia, el estudiante de evaluaci6n 
inexperto supone que los procedimientos de 
examen son tan sencillos y simples que una sola 
lectura rfipida del manual serd suficicnte como 
prcparacidn para la prueba. Aunque algunas 
pruebas individuales son sumamente rudimen- 
tarias y poco complicadas, muchas de ellas tie- 
nen aspectos complejos de aplicacidn que, si 
no se toman en cuenta, pueden causar que el 
individuo examinado falle de manera innece- 
saria en los reactivos. Por ejemplo, Choi y 
Proctor (1994) enconlraron que 25 entre 27 es- 
tudiantes de posgrado cometfan serios errores 
en la aplicacidn de la Stanford-Bind: Cuarta 
Edicidn, incluso aunque se vidcogrababan las 
sesioncs y los estudiantes sabfan que se eva- 
luarfan sus habilidades de prueba. La atencidn 
apropiada a los detalles dc aplicacidn es esen- 
cial para obtener rcsultados vSlidos. 

La necesidad de tener una fntima familia- 
ridad con los procedimientos de prueba se ilus- 
tra muy bien en la subprueba de Diseno con 
Cubos del WAIS-III (Wechslcr, 1997). Los 
materiales para la subprueba incluyen nueve 
bloques (cubos) de color rojo en dos lados, bian¬ 
co en dos lados y rojo y bianco en dos lados. La 
(area de la persona evaluada consiste en utili¬ 
zer los cubos para construir patrones represen- 
tados en tarjetas. Para los diseflos iniciales se 
necesitan cuatro cubos, mientras que en los di¬ 
seflos mds diffeiles se utilizan los nueve cubos 
(figura 2-3). 

Los individuos inteligentes no tienen difi- 
cultad para comprender esta larea y las instruc¬ 
ciones exactas no influyen de manera apreciable 
en su desempeflo. Sin embargo, las personas 
cuya inteligencia es promedio o inferior a 6ste 
requieren de las elaboradas demostraciones y 
correcciones que se especifican en el Manual 
del WAIS-III (Wechsler, 1997). En particular, 
el examinador muestra los primeros dos dise¬ 
flos y responde al dxito o fracaso del examina¬ 
do en elios, segun un flujo complejo de reaccidn 
y contrarreaccidn como se presenta en las tres 
paginas de instrucciones. Lo sentimos por cl 
examinador que no ha ensayado esta subprueba 
y anticipado la respuesta apropiada para las 
personas que fallan en los primeros dos diseflos. 
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Flgura 2-3. Materials simHares a la subprueba de 01- 
seftos con Cubos del WAIS-lll. 


SENSIBILIDAD HACIA LAS 
DiSCARAGDADES 

Otro ingrediente importantc de la aplicacidn 
vAlida de una prueba es la sensibilidad a las 
discapacidades de la persona evaluada. Las dis- 
capacidades en audicidn, visidn, habla o con¬ 
trol motor pueden distorsionar gravemente los 
resultados de prueba. Si el examinador no re- 
conoce la discapacidad fisica responsable del 
desempefio deficiente en la prueba, puede 
clasificarse al sujeto como discapacitado a ni- 
vel intelectuai o cmocional cuando, de hccho, el 
problema esencial es una discapacidad senso¬ 
rial o motora. 

Vemon y Brown (1964) informaron sobre 
el trigico caso de una nifia pequefia a la que se 
le releg6 a un hospital para individuos con re- 
traso mental, como consecuencia de la insensi- 
bilidad del examinador hacia una discapacidad 
ffsica. El examinador no se dio cuenta de que 
la nifia era sorda y concluyd que el Cl de 29 
en la Stanford-Binet era v61ido. La nifia per- 
maneci6 en el hospital durante cinco afios, pero 
se le dio de alta despuds de que obtuvo ;un Cl 
de 113 en una prueba de inteligencia basada en 
el desempefio! Despuds de dejar el hospital, in- 


gresd a una escuela para sordos y logrd buen 
progreso. 

Las personas con discapacidades pueden 
requerir pruebas especializadas para la evalua- 
ci6n vdlida. El lector encontrard una extensa 
discusidn de las pruebas disponibles para indi¬ 
viduos excepcionales en el tema 7A, Pruebas 
con poblaciones especiales. En esta seccidn nos 
concentraremos en los preocupantes problemas 
que surgen cuando se utilizan pruebas estandari- 
zadas para poblaciones normales con sujetos 
que tienen discapacidades Icvcs o modcradas. 
Incluimos andlisis por separado del proceso de 
prueba con individuos que tienen un problema 
de audicidn, visidn, habla o control motor. Sin 
embargo, el lector necesita saber que muchas 
personas excepcionales tienen multiples disca¬ 
pacidades (Tweedie y Shroyer, 1982), 

Las pruebas vdlidas con sujetos que tienen 
discapacidades auditivas requieren antes que 
nada que el examinador jdetecte la existencia 
de la discapacidad! Con frecuencia esto es m&s 
diffcil de lo que parece. Muchas personas con 
una pdrdida auditiva leve aprenden a compen- 
sar su discapacidad fingiendo que comprenden 
lo que otros dicen y esperando que las siguien- 
tes sefiales dentro de la conversacidn les ayu- 
den a aclarar las palabras o frases pcrcibidas 
apenas. Como resultado, olras personas —in- 
cluycndo los psicdlogos— pueden no darse 
cuenta de que el individuo con una alteracidn 
auditiva leve (iene alguna discapacidad. 

La incapacidad para percatarse de una pdr- 
dida auditiva constituye un problema en par¬ 
ticular para los individuos jdvenes, quienes, por 
lo general, son malos informantes de su disca¬ 
pacidad. Los nifios pequenos tambidn estin pro- 
pensos a perdidas auditivas fluctuanles, debido 
a la acumulacidn periddica de h'quido en el ofdo 
medio durante intervalos de enfermedad leve 
(Vemon y Alles, 1986). Un nifiocon una pdrdi- 
da auditiva fluctuante puede tener audicidn 
normal en la manana, pero s61o unas cuantas 
boras despuds percibe el habla dentro de una 
conversacidn como si fuera un susurro. 

Las indicaciones de una posible dificultad 
auditiva incluyen falta de respuesta normal ante 
el sonido, falta de atencidn, dificultades para 
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obedecer instrucciones orales, observacidn in- 
tcnsa de los labios del hablante y articulacidn 
dcficiente (Sattler, 1988). Hn todos los casos 
donde se sospecha la existencia de una altcra- 
ci6n auditiva, es crucial canalizar al sujeto a un 
examen audioldgico. Si se confirma un proble- 
ma auditivo grave, entonces el examinador de- 
berfa considerar el uso de una de las pruebas 
especializadas que se analizan en el tema 7A, 
Pruebas con poblaciones espcciales. En el caso 
de personas con una plrdida auditiva leve, es 
esencial que el examinador se coloque de fren- 
te al sujeto, hable m&s fuerte y repita las ins¬ 
trucciones lentamente. Tambidn es importante 
localizar una habitacidn silenciosa para la prue- 
ba. De manera ideal, dicha habitacidn tendril 
cortinas y superficies con textura en las pare- 
des para reducir al mfnimo los efectos distrac- 
tores de los ruidos de fondo. 

En contraste con los individuos que tienen 
alteraciones auditivas, las personas con discapa- 
cidades visuales generalmentc atienden bien a 
los materiales de prueba prescntados de modo 
verbal. La persona con alteraciones visuales 
introduce un tipo difercnte de reto para el exa¬ 
minador; detectar la existencia de una altera- 
cidn visual y despuds, asegurarse de que el sujeto 
puede ver bien los materiales de prueba. 

Detectar las alteraciones visuales es una 
cuestidn sencilla en los sujetos adultos —en la 
mayorfa de los casos, un individuo maduro 
informal libremente que tiene una alteracidn 
visual, en especial si se le pregunta. Sin embar¬ 
go, los nifios son malos informantes de sus 
capacidades visuales, de modo que los exami- 
nadores nccesitan conocer los signos y sfnto- 
mas de una posible altcracidn visual en nirtos 
pequefios. El sentido comun es un buen punto 
de inicio: los ninos que entrecierran los ojos, 
parpadean de manera excesiva o pierden cl 
lugar en la lectura, pueden tener un problema 
de visidn. Sostener los libros o los materiales de 
prueba cerca de los ojos es otro signo de sospe¬ 
cha. La visidn borrosa o doble puede significar 
problemas visuales, como los dolores de cabe- 
za o las nduseas despuds de leer. En general, es 
tan comun que los ninos requieran anteojos 
correctores, que los examinadores deben estar 


alertas a un problema de visidn en cualquier 
sujeto joven que no utilice anteojos y que no 
haya pasado por un examen rcciente de la vi- 
si6n. 

Dependiendo del grado de alteracidn visual, 
los examinadores necesitan realizar los ajustes 
correspondicntes en las pruebas. Si la vision del 
nifio no tiene un uso prdctico, deben utilizarse 
instrumentos espcciales con normas apropiadas. 
Porejemplo, estdn disponibles las pruebas Hays- 
Binet y Perkins-Binet para examinar a ninos 
ciegos. Estas pruebas se analizan en el tema 7A, 
Pruebas con poblaciones cspeciales. Por razones 
obvias, sdlo deben aplicarse las partes verbales 
de estas pruebas a ninos videntes que tienen un 
problema visual no corregido. 

Las alteraciones del habla representan otro 
problema para quienes deben hacer un diagnds- 
tico. Las respucstas verbales de las personas con 
alteraciones del habla son diffeiles de dcscifrar. 
Debido a la incapacidad del examinador para 
entender las respuestas, los sujetos pueden re- 
cibir un menor erddito del que merecen. Sattler 
(1988) relata el lamentable caso de Daniel 
Hoffman, un jovencito con alteraciones del ha¬ 
bla que pasd toda su ninez en clases para indi¬ 
viduos con retraso mental debido a que su Cl 
en la Stanford-Binct fue de 74 puntos. En rea¬ 
lidad, su inteligencia se encontraba dentro del 
rango normal, como lo revelaron otras pruebas 
basadas en el desempefto. En otro error trdgico 
de evaluacidn, a un paciente en Inglatcrra se le 
confind equivocadamente a un pabclldn para 
personas con retraso mental grave, debido a que 
su pardlisis cerebral produefa que su discurso 
fuera incomprensible. El paciente se encontra¬ 
ba limitado a una silla de ruedas y casi no tenfa 
control motor, por lo que su desempefto en las 
pruebas no verbales tambidn estaba sumamen- 
te deteriorado. El personal supuso que tenia un 
retraso grave, asf que el paciente pcrmanecid 
durante ddcadas en el pabelldn mds remoto. Sin 
embargo, se hizo amigo de un compafiero resi- 
dente que podfa comprender la intcrpretaci6n 
gutural que el paciente haefa del abecedario. 
El amigo tenfa un retraso grave, sin embargo, 
podfa reconocer las teclas en una mdquina de 
escribir. Con un laborioso esfuerzo para escribir 
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letra por letra, el paciente con pariilisis cerebral 
incapacitate escribid y publico su autobiogra- 
fia, utilizando a su amigo con retraso mental 
como un conducto hacia el mundo real. 

Incluso si su discapacidad es leve, las per¬ 
sonas con par&lisis cerebral u otras altcracio- 
nes motoras pueden recibir pcnalizacidn en 
pruebas de ejecucidn con Ifmite de tiempo. 
Cuando se sometc a prueba a una persona con 
una discapacidad motora leve, los examinado- 
res podrfan omitir las subprucbas de ejecucidn 
cronometradas o descontar estos rcsultados si 
son consistentemente m<1s bajos que las pun- 
tuaciones de las subprucbas sin Ifmite de tiem¬ 
po Si un sujeto ticne una discapacidad motora 
obvia —como lo es una dificultad para mani- 
pular las piezas de un rompecabezas— enton- 
ces los instrumentos cstandar aplicados de 
manera normal son generalmente inapropiados. 
Se han desarrollado de manera expresa varios 
instrumentos altemativos para examinar a per¬ 
sonas con pardlisis cerebral y otras alteracio- 
ncs motoras y las pruebas estdndar se han 
adaptado de modo ingenioso y se han estable- 
cido nuevas normas para cstas adaptaciones 
(tema 7A, Pruebas con poblacioncs cspcciales). 

PROCEDIMIENTOS OESEABLES 
CON PRUEBAS DE GRUPO 

Por lo comun, los psicdlogos y educadores su- 
ponen que casi cualquier adulto puede aplicar 
de manera adecuada las pruebas grupales, en 
tanto tenga el manual requerido. La aplicacidn 
de una prueba grupal parecerfa un procedimien- 
to simple y sencillo en el que se pasan los 
formatos y lapices, sc lecn las instrucciones, se 
toma el tiempo y se recogen los matcrialcs. 

En realidad, conducir una prueba grupal 
requicrc tanto refinamiento como aplicar una 
prueba individual, un punto que reconocid hace 
ados Traxler (1951): 

Es dudoso quo cualquier instituclbn educativa 
conflarta la apllcadbn y calilicacibn de la Escala 
Stanford-Blnet a cualquier persona que no fuera 
un psiedmetra entrenado, pero existe la impre- 
si6n bastante general entre qulenes manejan las 


escuolas de que casi cuaiqulera puede aplicar y 
calilicar una prueba grupal, con sdk> tenor un 
manual junto do sf. Sin embargo, de hecho, la 
aplicacidn do una prueba grupal a una clase de 
alumnos es, en cierto sentido, un procodimiento 
mas riguroso que aplicar una prueba individual a 
un solo alumno. La rutina os mbs rigida y la pena- 
Ikiad para los errores se multiplica por el numero 
de Individuos dentro del grupo. En la apUcacidn de 
una prueba individual se puede permitir un cierto 
grado de libertad de accidn, a Tin de crear una 
situacibn favorable para obtenor las respues- 
las de un individuo en particular: pero cuando 
se somele a prueba un grupo, es imperative la 
complete fidelidad hacia todos los detalles del 
procedimiento prescrito, si es que el examinador 
quiere evltar la pbrdida de tiempo de muchos in¬ 
dividuos y si los resultados deben tener el mis- 
mo signilicado para todos. 

Existen muchas maneras en que la aplicacidn 
y calificacidn negligentes pueden perjudicar 
los resultados de una prueba grupal, causan- 
do un sesgo para el grupo complcto o afec- 
tando s61o a ciertos individuos. A continuacidn 
se resumir^n sdlo las dcficicncias y los eno- 
res mils importantes y referimos al lector a 
Traxler (1951) y Clemans (1971) para un anfi- 
lisis m^s completo. 

Sin duda, la mas grande fuente de error en 
la aplicacidn de una prueba grupal ticne que 
vcrcon tomar de manera inadecuada el tiempo 
en las pruebas cronometradas. Los examinadores 
deben conceder el tiempo suficiente para el pro¬ 
ceso completo de prueba: organizacidn, lectu- 
ra de las instrucciones en voz alta y presentacidn 
de la prueba en sf por parte de los sujetos. Con¬ 
ceder el tiempo suficiente requiere previsidn en 
la programacidn. Por ejcmplo, en muchos am- 
bientes escolares, los ninos deben proceder a 
la siguiente clase en un horario establccido, sin 
considerar las actividades en proceso. Los 
examinadores sin experiencia podrfan sentir- 
se lentados a reducir el Ifmite de tiempo desig- 
nado para una prueba, de modo que se pueda 
respetar el horario de la escuela. Por supuesto, 
reducir el tiempo en una prueba causa que las 
normas scan complctamente inv&lidas y con 
toda probabilidad reduce la punluacidn de la 
mayorfa de los sujetos en el grupo. 

Conceder demasiado tiempo para una prue¬ 
ba puede constituir tumbicn un tremendo error. 
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Por ejemplo, considdrese el impacto de recibir 
tiempo adicional en la Miller Analogies Test 
(MAT; Prueba de Analogfas de Miller), una 
prucba de razonamiento de alto nivel que en 
algun tiempo requirieron muchas univcrsidades 
para la solicitud de ingrcso al posgrado. Dado 
que la MAT es una prueba con limite de tiem¬ 
po que neccsita de pensamiento analdgico nipido, 
conceder m£s tiempo permitirfa que la mayon'a 
de los individuos examinados resolvieran va- 
rios problemas adicionales. Es probable que estc 
tipo de error de prueba disminuina la validez 
de los resultados de la MAT, como mecanismo de 
prcdiccidn del desempeiio en el posgrado. 

Una segunda fuente de error en la aplica- 
ci6n de pruebas grupales es la falla de claridad 
en las instruccioncs para los examinados. Los 
examinadores deben leer las instmcciones con 
lentitud, con una voz clara y fuerte que atraiga 
la atencidn de los sujetos. Las instruccioncs no 
deben parafrasearsc. Cuando el manual lo per- 
mite, los examinadores deben detenerse en la 
lectura y aclarar las dudas de los individuos que 
tienen alguna confusidn. 

Las variaciones en las condicioncs ffsicas 
de aplicacidn de pmeba constituyen una terce- 
ra fuente de error potencial en la conduccidn 
de una prueba grupal. Los examinadores de¬ 
ben asegurarsc de que la habitacidn de examen 
cstd bien iluminada y, de ser nccesario, que ten- 
ga calefaccidn o aire acondicionado para con- 
trolar las variaciones extremas en cuanto a 
tempcralura y humedad. Clemans (1971) ha 
sehalado que es poco cornu n que los autorcs de 
pruebas entren en dctallcs sobre las especifica- 
ciones relativas a iluminacidn. temperatura y 
humedad, dado que los examinadores y suje¬ 
tos, con unas cuantas cxcepciones, tendnSn que 
tolerar las condiciones existentes. Sin embar¬ 
go, es obvio que los examinandos no pueden 
tener un desempeiio dptimo si se les somete a 
prueba en una habitacidn con iluminacidn po- 
bre o que es demasiado frfa u opresivamente 
caliente y humeda. Los examinadores previso- 
res deberfan hacerle cl favor a sus examinados 
de programar que las pruebas grupales impor- 
tantes se presenten en un ambientc agradable y 
bien iluminado. 


La calidad de la superficie de escritura puc- 
de tener una importancia crucial para las prue¬ 
bas grupales vdlidas, en especial con ninos. La 
afirmacidn de Traxler (1951) de que las cscue- 
las varfan ampliamente en sus instalaciones para 
la aplicacidn de pruebas grupales, todavfa es 
vdlida hoy en dfa: 

Tan sbto en la cuestidn del espacio para escribir, 
algunas escuelas emplean mesas grandes y c6- 
modas, otras usan pupitres, otras sfllas con bra- 
zos e Incluso otras aplican sus pruebas en un 
auditorlo, en el que cada alumno escribe en 
un "escritorto" portatil de cartdn o aun sobre sus 
rodillas. No es razonable esperar resultados 
lotalmente comparables bajo tales condiciones 
variables. 

La importancia de la superficie de escritura se 
aumenta por la icndcncia actual a utilizar hojas 
separndas de rcspucsta. Los sujetos necesitan 
de un espacio mds amplio de escritorio cuando 
emplean hojas separadas de respuesta que bajo 
otras condiciones. Aunque pocos editores de 
prueba lo senalan, sena bueno espccificar en 
los manuales de prueba las variaciones admisi- 
bles en cuanto a superficie de escritura que de 
todos modos permiten resultados comparables 
de prueba. 

El ruido es otro factor que debe contro- 
larse en las pruebas grupales. Durante algun 
tiempo se ha sabido que el ruido provoca una 
disminucidn en cl desempeiio, en especial para 
tareas de alia complejidad (p. ej. Boggs y 
Simon, 1968). Es de sorprender que exista poca 
investigacidn acerca de los efcctos del ruido en 
las pruebas psico!6gicas. Sin embargo, parece 
casi seguro que el ruido fuerte, en especial si es 
intermitente e imposible de predecir, causard 
que las puntuaciones de prueba se reduzcan de 
manera sustancial. No se puede esperar que los 
nifios en una escucla primaria tengan un buen 
desempeiio mientras que un obrero de la cons- 
truccidn golpea con un marro una pared de 
cementoen la habitacidn contigua. Para serjus- 
tos con los examinandos, existen ocasiones en 
las que debe reprogramarsc la aplicacidn de la 
prueba. 

Una cuarta fuente de error en la aplicacidn 
de una prueba grupal es la incapacidad para 
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cx plicarcu6ndo puedcn adivinarse las respues- 
tas y si est5 permitido haccrlo. Quizd con mis 
frecuencia quc cualquicr otra duda, a los cxa- 
minadores sc les prcgunta si “^cxistc alguna 
sancidn por adivinar mal una respuesta?" En la 
tnayorfa de los casos, quiencs dcsarrollan prue¬ 
bas anticipan estacuestidn y proporcionan pau- 
las explfcitas para los sujetos en cuanto a las 
vcnlajas. desventajas, o ambas, de conjeturar 
una respuesta. Los cxaminadores no dcben dar 
consejo adicional sobre adivinar las respuestas 
—ello constituirfa una grave desviacidn con 
respecto al procedimiento estandarizado. 

La mayorfade quicnes dcsarrollan pruebas 
incorporan una correccidn de conjeturas ba- 
sada en principios establecidos de probabilidad. 
Consid6rese una prueba de opcidn multiple 
que tiene cuatro alternativas por reactivo. En 
aqudlos donde cl sujeto realiza una conjetura 
aleatoria. sin tcner el conocimicnto, las proba- 
bilidadcs dc estar en lo correcto son de 1 cntre 
4, mientras que las probabilidades de estar mal 
son de 3 cntre 4. Asf, por cada tres conjeturas 
incorrectas. habrd una correcta que refleje la 
suerte mis que el conocimiento. Supdngase quc 
una nina responde correctamente a 33 pregun- 
tas de una prueba de 50 reactivos, pero en nue- 
ve preguntas sus respuestas son err6neas. En 
total ha respondido a 44 preguntas. dejando seis 
sin responder. El hecho de que haya elcgido la 
alternativa incorrecta en nueve preguntas su- 
giere que ha obtenido tres respuestas correctas 
por suerte mis quc por conocimicnto. Recuir- 
desc que, en el caso de las conjeturas alcatorias, 
sc cspera que haya, en promedio, tres respues¬ 
tas crrdneas por cada respuesta correcta, de 
modo quc para nueve respuestas incorrectas se 
esperarfan tres conjeturas correctas en otras 
preguntas. La puntuacidn corregida dc la nifia 
—aquella que de hecho se informa y se compa¬ 
re con las normas existentes— serfa entonces 
de 32, es decir, 35 mcnos 3. En otras palabras, 
es probable que conociera 32 respuestas, pero 
al adivinar en otras 12 aumentd su puntuacidn 
en otros 3 puntos. 

La correccidn para la puntuacidn que se 
ejemplifica en el pirrafo anterior, se refiere sdlo 
a las respuestas aleatorias, sin conocimientos. 


El efecto de tal correccion consiste en eliminar 
las ventajas que dc otra mancra se concedenan 
a quienes toman riesgos de manera aventurada. 
En algunos casos, un indi viduo examinado pue- 
de eliminar una o dos de las alternativas, con lo 
cual aumenta las probabilidades de adivinar co¬ 
rrectamente entre las opciones restantes. En esta 
situacidn puede ser adccuado que la persona 
Irate de adivinar la respuesta. 

El que una conjetura basada en conocimien¬ 
tos conceda en realidad una ventaja a la perso¬ 
na examinada, depende en parte dc la diabdlica 
habilidad de quien escribe el reactivo. Traxler 
(1951) sehala que: 

En efecto, el redactor del reactivo Intenta hacer 
que cada respuesta incorrecta parezea Ian plau¬ 
sible que todos los examlnandos que no poseen 
la habilidad o capacidad deseada selecciona- 
rfin la respuesta Incorrecta. En otras palabras, la 
meta del redactor del reactivo consiste en lograr 
que todas o casi todas las conjeturas considera- 
das sean conjeturas errdneas. 

Un redactor hibil de reactivos puede diseftar 
preguntas de modo que la alternativa correcta 
sea totalmente contraria a la intuicidn y las al- 
temativas incorrectas tengan una cualidad per- 
suasivamente atracti va. Para estos reactivos, una 
conjetura basada en conocimientos es casi siem- 
pre incorrecta. 

Sin embargo, muchos creadores de prue¬ 
bas le aconsejan ahora a los sujetos que reali- 
cen conjeturas basadas en sus conocimientos, 
pero advierten en contra de las conjeturas 
alcatorias. Porejcmplo, una reciente cdicidn del 
manual de preparacidn para la prueba SAT, 
Taking the SAT, aconseja: 

Debldo a la manera en que se califica la prueba. 
es poco probable que las conjeturas fortuitas o 
aleatorias para las preguntas de las que usted 
no sabe nada camblen su califica cldn, Cuando 
usted sabe que se puoden eliminar una o mas 
opciones, adivinar la respuesta entre las opcio¬ 
nes restantes puede constituir una ventaja a su 
favor. 

Ya sea quc una prueba grupal utilice o no una 
correccidn para la puntuacidn, el punto impor¬ 
tant reside en enfalizar en este contexto quc 
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quien aplica la prueba debe seguir el procedi- 
miento estandarizado y nunca ofrecer consejo 
adicional acerca de adivinar las respueslas. En 
las pruebas grupales, las desviaciones con res- 
pecto al manual dc inslrucciones son simple- 
mente inaceptables. 

UINFLUENCIA DEL EXAMINADOR 


LA IMPORTANC1A DEL RAPPORT 

Los cditores dc pruebas instan a los cxamina- 
dorcs a establecer un rapport —una atmdsfera 
cdmoda y cdlida que sirva para motivar a los 
examinandos y que cduzca la coopcracidn. Dar 
lugar a un ambiente cordial para la prueba es 
un aspecto crucial de una prueba vblida. Un 
examinador que no establece rapport puede 
provocar que una persona reaccione con ansie- 
dad, falta dc coopcracidn dc naturalcza pasivo- 
agresiva u hostilidad abierta. El fracaso para 
establecer el rapport distorsiona los datos de la 
prueba: se subestima la capacidad y se hace un 
juicio inadecuado de la personalidad. 

El rapport cs de particular importancia en 
las pruebas individuates y en particular cuando 
sc evalua a nifios. Wechslcr (1974) ha scfialado 
que cl establecimiento del rapport crea fuertes 
demandas sobre las habilidades clfnicas del 
examinador: 

Debe lograr que el nIAo se sienta cbmodo, man- 
tenerio inleresado en las tareas en cueslibn y 
alentarto a reallzar su mejor estuerzo. No exlste 
una fdcmula mbgica para "ganarse" al nWto; las 
aproximadones que llenen bxito con algunos nl- 
nos pueden enfadar a otros. Con experiencla, el 
examinador desarrollara una perceplividad que 
le pormitira establecer retadones cordiales con 
los nirVos y adaptarse a las necesldades especl- 
ficas de cada uno. Las sugerencias generales 
que aparecen a continuacibn se ofrecen para 
ayudar al examinador en sus estuerzos. 

Para lograr que el nifto se sienta cbmodo 
con su entorno, el examinador podrfa hacer que 
partlcipe en alguna con versa dbn informal, antes 
de adenlrarse en el asunto mbs serlo de aplicar 
la prueba. Con frecuencia, hablar con 61 acerca 


de sus pasatiempos o intereses es una buena 
manera de romper el hlelo, aunque en el caso de 
un nino timido, puede ser mejor alentarto a que 
hable sobre algiin aspecto concreto del ambien¬ 
te —un cuadro en la pared, un animal en el salbn 
de dases o un libro o juguete (que no sea parte 
del material de prueba) en la habltacldn de exa- 
men. En general, este periodo Introductory* no 
requiere mbs de 5 a 10 minulos, aunque la prue¬ 
ba no debe comenzar hasta que el nifio parezea 
lo sulicienlemente relajado como para dar su 
mbximo esfuerzo. 

Un estudio de Gregory, Lehman y Mohan (1976) 
ilustra la importancia de establecer rapport 
cuando sc examina a los nifios. Estos investi- 
gadores buscaron determinar los efectos del 
bajo nivel de exposicidn al plomo sobre el Cl 
al aplicar el WISC a 193 nifios que vivfan cer- 
ca de una fundicidn de plomo. Los nifios se asig- 
naron a cincodiferentes estudiantes de posgrado 
que aplicaron las pruebas, con base en una ro- 
tacidn casi aleatoria en la que el examinador 
que estuviera libre atendfa al primer nifio que 
llegara. Los grupos de nifios sometidos a prueba 
por cada uno de los cinco psiedmetras no diferfa 
en el promedio de edad, exposicidn al plomo o 
clase social. Lo que es mds, las magnitudes dc 
las muestras eran sustanciales, ya que su nu- 
mcro iba de los 30 a los 45 nifios. De aquf que el 
promedio de los Cl examinados dentro de los 
cinco grupos deberfa haber sido muy similar. 

Sin embargo, las diferencias entre los Cl 
examinados en los cinco grupos fueron peno- 
samente grandes, con puntuaciones promedio 
que variaban hasta 14 puntos. Clasificadas dc 
menor a mayor, las puntuaciones promedio 
de los cinco grupos fueron 90,94,95,96 y 104. 
El examinador cuyos sujetos obtuvieron en 
promedio un Cl de 90 era muy formal, preciso, 
frfo y apresurado. De hecho examind con 
mucho a la mayorfa de los sujetos (45, en 
comparacidn con 37 del siguiente examinador 
mds prolffico) y, en general, terminaba mucho 
antes con cada nifio. En el otro extremo se en- 
contraba el examinador, cuyos sujetos obtu¬ 
vieron un Cl promedio de 104. Fue mucho 
mds allb del buen rapport, hasta Uegar al grado 
de ofrecer apoyo y aliento que rayaba en con¬ 
duct a los sujetos a la respuesta corrccta. Por 
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ejemplo, en Diserin con Cubos inst6 a un nifio a 
"Vamos, coloca los cubos de las esquinas y si- 
gue a partir de allf 

Por tanto, los examinadores pucdcn diferir 
en cuanto a sus capacidades para establecer 
rapport. Es probable que los examinadores frfos 
oblengan menos cooperation de sus sujetos, lo 
cual tiene como consecuencia que sc reduzca 
el desempefio en una prueba de capacidad o que 
se obtengan resultados distorsionados o defen¬ 
sives en pruebas de personalidad. Los exami¬ 
nadores demasiado solfcitos pueden error en la 
direccidn opuesta, dando senales sutiles (y en 
ocasiones mas que obvias) de las respucstas 
correctas. Se deben evitar ambos exlremos. 


SEXO, EXPERIENQA Y RAZA 
DEL EXAMINADOR 

Un amplio conjunto de investigaciones ha bus- 
cado determinar si ciertas caracterfsticas del 
examinador causan cl aumento o la disminucidn 
de las puntuaciones de las personas evaluadas 
con pruebas de capacidad. Por ejemplo, ^tiene 
importancia que el examinador sea vardn o 
mujer? ^Que tenga cxperiencia o que sea un 
novato? iQue sea de la misma raza o de una 
diferente a la del sujeto? Nos abstendremos de 
revisar estos estudios —con unas cuantas ex- 
cepciones— por una simple razdn: los resulta¬ 
dos son contradictorios y, por tanto, no son 
concluyentes. La mayorfa de los estudios cn- 
cuentran que el sexo, la experiencia y la raza 
del examinador causan poca o ninguna diferen- 
cia. Lo que es mis, los pocos estudios que in- 
forman de un fuerte efecto en una dircccidn 
(p. ej., las mujeres examinadoras obtienen pun¬ 
tuaciones mis alias de Cl de sus sujetos), se 
contradicen por otros estudios que muestran la 
tendencia contraria. El lector interesado puede 
consultar a Saltier (1988) para un anilisis y un 
extenso listado de referencias. 

Sin embargo, serfa incorrecto concluir que 
el sexo, la experiencia o la raza del examinador 
nunca afcctan las puntuaciones de prueba. En 
casos aislados, bicn podrfa ser que una caracte- 
rfstica particular de un examinador tuviera un 


fuerte efecto sobre las puntuaciones de prueba 
de la persona evaluada. Por ejemplo, Terrell, 
Terrell y Taylor (1981) demostraron de manera 
ingeniosa que la raza del examinador tiene una 
potente interaccidn con el nivel de confianza 
de los individuos afroestadounidenscs sometidos 
a una prueba de Cl. Estos investigadores identifi- 
caron a cstudiantes uni versitarios afroestadouni- 
denses con niveles alto y bajo de desconfianza 
hacia las personas de raza blanca; entonces, un 
examinador de raza blanca le aplico el WAIS a 
una mitad de cada grupo, mientras que a la otra 
mitad la evalud un examinador afrocsiadouni- 
dense. El grupo con alto nivel de desconfianza 
al que examind un psiedmetra afroestadouni- 
dense tuvo una puntuacidn significativamente 
mayor, que el grupo con alto nivel de descon¬ 
fianza evaluado por un examinador de raza 
blanca (Cl promedio de 96 contra 86, respecti- 
vamente). Ademis, el grupo con bajo nivel de 
desconfianza examinado por un psiedmetra 
de raza blanca tuvo puntuaciones un tanto mayo- 
res que cl grupo con bajo nivel de desconfianza 
evaluado por el examinador afroestadounidense 
(Cl promedio de 97 contra 92, respcctivamen- 
te). En suma, los autores concluyeron que los 
afroestadounidenscs dcsconfiados tienen un de¬ 
sempefio deficiente cuando los someten a prue¬ 
ba examinadores de raza blanca. Los datos que 
tienen que ver con este tipo de efecto racial son 
pocos y seguramente queda espacio para rcali- 
zar investigaciones adicionales. 

B ANTECEDENTS Y MOTlVAClbN 
DE LA PERSONA EXAMINADA 


Los examinandos difieren no sdlo en las carac¬ 
terfsticas que los examinadores desean evaluar, 
sino tambidn en otros aspectos ajenos que 
podrfan alterar los resultados de prueba. Por 
ejemplo, un individuo inteligente podrfa lener 
un desempeho deficiente en una prueba cro- 
nometrada de la capacidad debido a ansiedad 
ante dsta; un asesino cuerdo podrfa tener el pro- 
pdsito de parecer mentalmente enfermo en un 
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inventario de personalidad con la finalidad de 
evitar una acusacidn; un estudiante con capaci- 
dad promcdio podrfa prepararse para tener un 
mejor desempefio en una prueba dc aptitud. 
Algunos sujclos carecen totalmente de motiva- 
cidn y no les interesa si obticnen un buen rcsul- 
tado en pruebas psicoldgicas. En todos estos 
casos, los resultados de prueba pueden ser im- 
prccisos debido a los efectos penetrantes y cau- 
santes de distorsidn de ciertas caractcrfsticas del 
examinando como la ansiedad, simulacidn, en- 
trenamiento o antecedentcs culturales. 

ANSIEDAD ANTE LA PRUEBA 

La ansiedad ante la prueba se refiere a aque- 
llas respuestas fcnomenoldgicas, fisioldgicas y 
conductuales que acompanan a la preocupacidn 
acerca del posible fracaso en una prueba. No 
hay duda de que los sujetos experimentan dife- 
rentes nivclcs de ansiedad ante la prueba, que 
van desde una actitud dcspreocupada, hasta un 
temor incapacitantc ante cl prospecto de que se 
les someta a prueba. 

Se han desarrollado varios cucstionarios de 
verdadero-falso para evaluar las diferencias 
individuates en ansiedad ante la prueba (p. ej., 
Sarason, 1980; Morris, Davis y Hutchings, 
1981). A continuacidn se enumeran reactivos 
caracterfslicos y la direccidn de su respuesta (V 
para verdadero, F para Falso): 

(V) Cuando realizo un examen i mportan- 
te, sudo en gran cantidad. 

(V) Me paralizo cuando presento pruebas 
de intcligcncia o examenes esco- 
lares. 

(F) En realidad no comprendo por qud las 
personas se angustian tanto acerca de 
las pruebas. 

(V) Me aterran los cursos dondc al ins¬ 
tructor le gusta hacer ex&menes “sor- 
presa”. 

Un amplio cuerpo de investigacidn ha confir- 
mado el concepto de sentido comun dc que la 
ansiedad ante la prueba se correlaciona en senti¬ 


do negativo con el rendimiento escolar, las pun- 
tuaciones dc pruebas de aptitud y las medidas 
de intcligcncia (Naveh-Benjamin, McKeachie 
y Lin. 1987; McKeachie. 1984). Sin embargo, 
la interprctacidn de estos descubrimientos dc 
correlacidn no es simple. Una posibilidad es que 
los estudiantes dcsarrollen ansiedad ante la 
prueba, debido a antecedentes dc tener un mal 
desempefio en los cxdmenes. Es deeir, las dis- 
minuciones en desempeno pueden anteceder y 
causar dicha ansiedad. En apoyo a estc punto 
dc vista, Paulman y Kennelly (1984) encontra- 
ron que —con independencia de su ansiedad— 
muchos estudiantes con ansiedad ante la prue¬ 
ba tambidn Ionian ineficiencias en prcsentacidn 
de exdmenes en ambientes acaddmicos. Dichos 
estudiantes lograban pobres resultados en prue¬ 
bas, estuvieran ansiosos o no. Lo que es mds, 
Naveh-Benjamin, McKeachie y Lin (1987) 
determinaron que una gran proporcidn de estu¬ 
diantes universilarios con ansiedad ante la prue¬ 
ba (enian malos hdbitos de estudio que los 
predisponian a un pobre desempeno en prue¬ 
bas. La ansiedad de estos individuos es, en par¬ 
te, un subproducto de la frustracidn que han 
tenido toda la vida con respecto a resultados 
mediocrcs en pruebas. 

Otras lineas de investigacidn indican que 
la ansiedad ante la prueba tiene un cfecto per- 
judicial directo sobre el desempefio en prue¬ 
bas. Es deeir, es probable que esta ansiedad sea 
tanto una causa como un efecto en la ecuacidn 
que la vincula con el desempefio deficicnte en 
pruebas. Considdrese el estudio original que 
realizd Sarason (1961) sobre este tema, quicn 
sometid a prueba a sujetos con alta y baja an¬ 
siedad bajo instrucciones neutras o inductoras 
de ansiedad. Los sujetos eran estudiantes uni- 
versitarios a los que sc les pidid que memoriza- 
ran palabras dc dos sflabas con un bajo nivcl de 
significado —una tarea dificil. La mitad de los 
sujetos trabajd bajo instrucciones neutras —sim- 
plemente se les dijo que memorizaran las 
listas. A los sujetos restantes se les dijo que 
memorizaran las listas y que la tarea era una 
prueba de intcligencia. Se les instd a tener el 
mejor desempeno posible. Los dos grupos no di- 
firieron de manera significativa en su desempeno 
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cuando las instrucciones eran neutras y no 
amenazantes. Sin embargo, cuando dstas exci- 
taban la ansiedad, los niveles de dcscmpeno de 
los sujetos con alto grado de ansiedad descen- 
dieron de modo notable, dejdndolos con una 
enorme desventaja, en comparacidn con aque- 
llos quc tenfan baja ansiedad. Esto indica que 
los sujetos con ansiedad ante la prucba mues- 
tran disminuciones significativas en su desem- 
pefio cuando perciben la situacidn como una 
prueba. En contraste, los sujetos con bajo nivel 
de ansiedad sufren un efeclo rclativamente 
nulo de tai redcfinicidn simple del contexto. 

Las pruebas con eslrictos Ifmites de tiem- 
po representan un problema especial para las 
personas con altos niveles de ansiedad ante la 
prueba. La presidn de tiempo parece exacerbar 
el grado de amenaza personal, causando reduc- 
ciones significativas en el desempcrto de las 
personas con ansiedad ante la prueba. Siegman 
(1956) dcmostrd este punto hacc muchos afios 
al comparar los niveles de desempefio de pa- 
cientes mddicos/psiquiatricos con alta y baja 
ansiedad en las subprucbas con y sin Ifmite de 
tiempo del WA1S. El WAIS consiste de 11 sub¬ 
prucbas que inciuyen seis subprucbas para las 
cuales el examinador utiliza un crondmetro, a 
Fin de imponer cstrictos Ifmites de tiempo y cin- 
co subprucbas para las cuales el sujeto tiene un 
tiempo ilimitado de respuesta. Es interesante 
que los sujetos con alta y baja ansiedad luvieron 
una capacidad total iddnlica en el WAIS. Sin 
embargo, cada grupo tuvo un mejor desempe- 
fio en la direccidn prevista en los diferentes ti- 
pos de subpruebas. En particular, los sujetos 
con bajo nivel de ansiedad superaron a aqud- 
llos con ansiedad clevada en las subpruebas con 
Ifmite de tiempo, mientras que se observd el 
patrdn inverso en las subpruebas sin Ifmite de 
tiempo (figura 2-4). 


mohvaci6n para el engano 

Los resultados de prueba pueden ser imprccisos 
si la persona tiene razoncs para dcsempefiarse 
de una manera inadecuada o no representative. 
El falscamiento abierto de los resultados de 



Figura 2-4. Inlluencia de los Ifmites de tiempo y del 
nivel do ansiedad en los resultados de subpruebas del 
WAIS. 

Fuente: Basado en dalos de Siegman, A. W. (1956). 
The effect of manifest anxiety on a concept formation 
task, a nondlrected learning task, and on timed and 
untimed Intelligence tests. Journal of Consulting Psy¬ 
chology, 20, 176-178. 

prueba es poco comun, pero llega a sucedcr. 
Una pequefia fraccidn de personas que buscan 
beneftciarse de la rehabilitacidn o de institu- 
ciones sociales “se t'ingiran malos” en pruebas 
de personalidad o de capacidad. En ocasiones, 
las personas que anticipan una acusacidn cri¬ 
minal Fingirdn enfermedad mental en pruebas 
de personalidad. Considdrese el caso del clien- 
te de psicoterapia que contestd una prueba de 
personalidad por instrucciones de su terapeuta. 
El terapeuta dcseaba una cvaluacidn precisa de 
la depresidn aparentemente levc del cliente. Los 
resultados Fueron ambiguos, lo cual indica ya 
sea un grado monumental de trastomo psico- 
Idgico o un intento conscicnte de exagerar los 
sfntomas. Dos semanas despuds, el terapeuta 
descubre de manera inadvertida que el cliente 
estd a punto de ser acusado de abuso sexual 
infantil. En apariencia, habfa falseado los re¬ 
sultados de prueba anticipando que pronto sc 
harfan cargos legates en su contra. En parte, 
habfa planeado defenderse aduciendo que la 
enfermedad mental era una factor atenuantc 
para su conducta. 

En la mayorfa de los casos, un psiedmetra 
bicn entrenado puede dctcctar el falseamiento 
conscicnte al hacer dos preguntas: 1) ^E1 clien¬ 
te tiene motivacidn para tener un dcscmpeno 
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cnganoso en las prucbas? 2) ^E1 patr6n general 
de resultados cs sospechoso a la luz de otra in- 
formacidn conocida acerca del clienle? Si la 
respucsta para ambas preguntas es “Sf”, enton- 
ces el examinador harla bien en abordar con 
escepticismo los resultados de prueba. 

EFECTOS DEL ENTREN AMIENTO 
SOBRE LOS RESULTADOS DE PRUEBA 

Psic61ogos y educadorcs han cstudiado amplia- 
mentc la influencia del entrenamiento sobre los 
resultados de prueba. El entrenamiento puede 
incluir varios componentes: prdctica adicional 
en matcriales similares a la prueba, revisidn de 
conceptos fundamentales que es probable que 
cubra la prueba y consejo sobre las cstrategias 
dptimas de presentacidn de prueba. Aquf sdlo 
se pueden mencionar unos cuantos puntos so- 
bresalicntes, con un dnfasis particular sobre las 
pruebas de aptitud. Los lectores que descen co* 
nocer mils detalles pueden consultar a Anastasi 
(1981) y Bond (1989). 

No hay duda que el entrenamiento puede 
aumentar significativamente las puntuaciones 
en ciertos tipos de pruebas de aptitud que contie- 
nen tipos de reactivos de prueba que pueden 
“enirenarse”. Por ejemplo. Powers y Swinton 
(1984) enviaron porcorreo varios conjuntos de 
maieriales de prcparaci6n de prueba a mues- 
tras aleatorias de candidatos para cl Examen 
de Seleccidn para el Posgrado (GRE, del in- 
glds Graduate Record Examination), aproxima- 
damente cinco semanas antes de la aplicacidn 
de la prueba.* Los materiales de prcparacidn 
para la prueba inclufan pruebas adicionales de 
prdctica, explicaciones para las preguntas de las 
pruebas de prSctica y pistas o estrategias para 
responder diferentes tipos de reactivos. Inci- 
dcntalmente, las calificaciones de prueba en el 
GRE van, por lo general, de 200 a 800, con un 


* Los comitds dc aceplacidn de muchas cscuelas de 
posgrado requieren cl GRE. Durante cl periodo en 
que Powers y Swinton (1984) estudiaron el GRE, este 
examen consistla de las partes verbal, cuantilativa y 
analltica. 


promedio nacional de aproximadamente 500. 
La prueba general incluye tres secciones: ver¬ 
bal, cuantilativa y analltica. A travds de la 
comparacidn del desempeno de los sujetos ex- 
perimentales con los sujetos control que no 
recibieron materiales complementarios dc pre- 
paracidn de prueba, Powers y Swinton (1984) 
pudieron deducir que cuatro horas dc prepara- 
cidn de autoadiestramiento produclan como 
dividendo un aumento de 53 puntos en la escala 
dc Prueba Analltica del GRE. Este descubri- 
miento fue comparable con un aumento de 66 
puntos en una intervencidn a travds de un ins¬ 
tructor, la cual implicaba siete horas de contacto 
dirccto (Swinton y Powers, 1983). 

Sin embargo, los cfectos observados en 
estos estudios fueron sumamente especlftcos. 
Los materiales especiales de preparacidn pa¬ 
ra los reactivos anallticos actuaron sdlo sobre las 
puntuaciones anallticas, no sobre las verbales 
o cuantitativas. De hecho, los efectos se res- 
tringieron sdlo a los tipos particulares de reacti¬ 
vos anallticos que eran entrenables —aquellos 
que implicaban analisis de explicaciones y 
diagramas Idgicos. El desempeno en otros tipos 
de reactivos anallticos —por ejemplo, razona- 
miento analltico— no se vio afectado. 

El entrenamiento representa un grave pro- 
blema para quienes dcsarrollan pruebas, debi- 
do a que puede inflar la puntuacidn de una 
persona sin mejorar de manera correspondicn- 
te sus capacidades generates en el dominio que 
se somete a prueba. Si esto ocurTe, la puntua¬ 
cidn ya no es una representacidn b&sica de la 
capacidad del examinando. Asl, el entrenamien¬ 
to puede invalidar las normas cxistentes. Con 
toda seguridad, el entrenamiento hace surgir el 
fantasma de los privilegios en cuanto a prepa- 
racidn de pruebas para los estudiantes ricos o 
astutos, a expensas de aquellos pobres o des- 
informados. Despuds de todo, abundan las es- 
cuelas privadas de entrenamiento que pueden 
cobrar miles de ddlares por un dfa o dos de pre- 
paracidn para los cxfimencs de aptitud. 

Por fortuna, existe una solucidn parcial para 
el problema del entrenamiento: poner a dispo- 
sicidn de todos el entrenamiento a travds del 
autoadiestramiento. La mayorla de los princi- 
pales programas de prueba, incluyendo al GRE, 
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proporcionan ahora muesiras de los materiales 
de prueba, dc modo que los individuos que pre- 
senten el examen puedan famiiiarizarse con la 
naturaleza de las preguntas. Por supuesto, csto 
no gorantiza que todos utilizardn los materiales, 
pero al menos la oportunidad cstd disponible 
de manera inmediata sin ningun costo. Los es- 
tudiantes que se nicgan a inspeccionar los ma¬ 
teriales de familiarizacidn con la prueba lo 
haccn bajo su cuenta y riesgo. 

B ASPECTOS SOBRE CALIFICAa6N 

En general, las pruebas grupales emplean un 
formato de opcidn multiple en el cual el cxami- 
nando marca con un Idpiz las respuestas en una 
hoja separada de respuestas, la que se califica 
entonccs a travds de una mdquina con total ob- 
jetividad y precision. En consecucncia, es poco 
comun que las pruebas grupales prescntcn una 
oportunidad para el error humano en la califi¬ 
cacidn. Sin embargo, los errores de calificacidn 
puedcn colarse en las pruebas grupales califi- 
cadas por medios mecdnicos, si las personas 
examinadas no oscurecen lo suficiente las dreas 
de respucsta con un ldpiz de punto suave o si 
dejan marcas no relacionadas en la hoja de res¬ 
pucsta. Para protegerse dc esta fuente de error, 
los examinadores deben revisar cada hoja de 
respuesta y corregir cualquier irrcgularidad en 
las marcas con Idpiz, antes dc somcter los ma¬ 
teriales a la calificacidn mecdnica. 

Los errores de calificacidn ocurren con las 
pruebas individuates en las que cl examinador 
debc hacer juicios de calificacidn, sumar co- 
lumnas de numeros y consultar tablas para con- 
vertir las puntuaciones brutas en Cl o en otras 
estadisticas dc resumen. Contrario a la creen- 
cia popular, los juicios del examinador con res- 
pecto a la calificacidn —por ejemplo, el que 
una cierta respuesta en una prueba de Cl me- 
rezea 1 o 2 puntos de puntuacidn bruta— casi 
nunca representan una fuente de error de cali- 
ficacidn. Se ilustrard esta situacidn con una 
prueba individual del Cl, pcroello se aplica tam- 
bien a la mayorfa de las demis pruebas indivi- 


dualcs. Incluso cuando los examinadores se 
equivocan de manera flagrante en una direc- 
cidn conservadora, conccdiendo de manera con- 
sistente a un sujeto un erddito menor del que 
mercce por respuestas ambiguas o lim/trofes, 
el cfecto neto sobre el Cl Total es mfnimo, qui¬ 
zes en uno o dos puntos cuando mds. La razdn 
para que los errores de juicio raramente sig- 
nifiquen una diferencia seria es sencilla: los 
critcrios de calificacidn de la mayorfa de las 
pruebas se expresan con tanto detaile que en 
raras ocasiones se demanda "un juicio” por 
parte del examinador. 

Los errores de calificacidn de fndole admi- 
nistrativa son totalmente otra situacidn. Estos 
tipos de errores ocurren con mucha mayor fre- 
cuencia de lo que los psicdlogos desearfan ad- 
mitir alguna vez. Como se verd, los errores 
administrativos de calificacidn pueden tener 
efectos desastrosos. 

Ryan, Prifitcra y Powers (1983) le pidie- 
ron a 19 psicdlogos y a 20 estudiantes de 
posgrado que calificaran los protocolos del 
WAIS-R de dos clientes de orientacidn voca- 
cional. Para un clicntc cuyo Cl Total era de 110, 
los psicdlogos practicantes calcularon puntua¬ 
ciones que iban dc 107 a 115 y los estudiantes 
de posgrado obtuvieron puntuaciones que 
iban de 108 a 117. Las variaciones en puntuacidn 
se debieron en gran medida a errores admi¬ 
nistrativos de calificacidn, no a diferencias de 
juicio en cuanto al erddito adecuado para res¬ 
puestas ambiguas o limftrofes. Gregory (1987) 
ha ilustrado en mucho el mismo punto con un 
grupo de estudiantes avanzados de posgrado 
que cometicron errores que abarcaron hasta 30 
puntos al calificar un protocolo de una prueba 
estdndar de Cl, de Wechsler. Por tanto, se pue- 
de conjeturar que los errores de calificacidn sf 
ocurren con frecuencia y comprometen grave- 
mente la precisidn de la evaluacidn del Cl y de 
otras formas de pruebas psicoldgicas. Este pro- 
blcma no desaparece tan sdlo con un aumento 
en la experiencia. La unica manera de evitar los 
errores administrativos de calificacidn consiste 
en exponer qud tan extendido estd el problema y 
alentar a los examinadores a ejercer un gran 
cuidado en la calificacidn de los protocolos. 
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1. Los procedimientos estandarizados de exa- 
men son escnciales para una prucba vdlida. 
El uso de procedimientos no estandarizados 
pucdc alterar el significado de los rcsulla- 
dos de prueba, lo cual los vuelve inv&lidos 
y enganosos. 

2. Sin embargo, la flexibilidad en los procedi¬ 
mientos de prueba es apropiada cuando cs 
razonada y deliberada. Para determinar si 
cs aceptable un cambio flexible en los pro¬ 
cedimientos de prueba, el examinador debe 
suponer c6mo es mSs probable que sc haya 
aplicado la prueba a la muestra normativa. 

3. En las pruebas individuales, es deseable que 
el examinador se familiarice en gran medi- 
da con los materiales de prueba. Es necesa- 
rio que se ensaye con la prueba, de modo 
que el examinador pueda anticipar las res- 
puestas apropiadas ante las numerosas con- 
tingencias que ocurren durante la aplicacidn 
de la misma. 

4. Otro ingrediente importante en una prueba 
v&lida es la sensibilidad a las discapacidadcs 
de la persona examinada. Cuando no se re- 
conocen las discapacidades, pueden ocurrir 
graves errores en la interpretacidn de la 
prueba; por ejemplo, a una persona con sor- 
dera se le puede diagnosticar de manera 
equivocada como si tuviera rctraso mental. 

5. En la aplicacidn de pruebas grupales, los 
examinadores deben adherirse de modo es- 
tricto a las inslrucciones orales y a los If- 
mites de tiempo definidos. Adem^s, las 
condiciones de prueba deben ser apropia¬ 
das; por ejemplo, iluminacidn adecuada y 
ruido mfnimo. 

6. En especial cuando se trata de la aplicacidn 
de pruebas individuales, se insta a los exa¬ 
minadores a establecer el rapport. En prue¬ 
bas, el rapport es una atmdsfera edmoda y 
cdlida que sirve para motivar a los exami- 
nandos y para facilitar la cooperacidn. 

7. Por el contrario de la expectativa popular, 
la mayorfa de los estudios encuentran que 


el sexo, la experiencia y la raza del examina¬ 
dor tienen poco cfecto sobre los resultados 
de una prueba psicoldgica. Sin embargo, 
pueden haber casos especiales en los que 
las interacciones examinador-examinando 
producen efectos perjudiciales sobre las 
puntuaciones de prueba. 

8. La ansiedad ante la prueba se refiere a aque- 
llas respuestas fenomenoldgicas, fisioldgi- 
cas y conductuales que acompafian a la 
preocupacidn sobre un posiblc fracaso en 
una pmeba. Se ha mostrado que la ansie¬ 
dad ante la prueba se correlaciona en senti- 
do negativo con cl rendimiento escolar, las 
puntuaciones en pruebas de aptitud, las mc- 
didas de inteligencia y con el desempefio en 
pruebas con 1 finite de tiempo. 

9. El falseamiento de los resultados de prueba 
cs poco comun, pero llcga a ocurrir. En la 
mayorfa de los casos, un examinador bien 
entrenado puede detectar el falseamiento 
consciente al cueslionar si el cliente tienc 
motivacidn para tener un desempefio enga- 
fioso en las pruebas o si el palrdn general 
de resultados de prueba es sospechoso a la 
luz de otras informacioncs. 

10 . El entrenamiento puede mejorar las califi- 
caciones de prueba en cicrtos tipos de 
reactivos entrenables, como la porcidn ana- 
Iftica del Examen dc Seleccidn para el 
Posgrado (GRE). La prdclica con reactivos 
de muestra y las pistas o estrategias de 
aprendizaje pueden elevar la puntuacidn 
de subprueba de la GRE en 50 a 60 puntos 
en la escala de 800 puntos. 

11 . En la calificacidn de pruebas individuales, 
las difcrencias en el juicio personal —por 
ejemplo, asignar a una respucsta de prueba 
un punto en lugar de dos en puntuacidn bru- 
ta— raramente influyen sobre la puntuacidn 
total de prueba en algun grado considera¬ 
ble; por ejemplo, 1 o 2 puntos del Cl Total, 
cuando mSs. 




Pruebaa y su proceso de apllcaclon •67 


12. Los errores administrativos de calificacidn 
—p. ej„ sumar de manera incorrecta cdum- 
nas dc puntuaciones o consullar la tabla 
inadecuada de referenda— reprcscntan un 


serio problema en las pruebas psicoldgicas 
individuales. Estos tipos de errores pueden 
causar que las puntuaciones de prucba sean 
obviamentc imprecisas. 


R TERMINOS Y CONCEPTOS CLAVE 


Correccidn de conjeturas 

p. 59 
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p. 64 
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Esc capftulo se ocupa de dos conceptos 
bdsicos necesarios para facilitar la interpreta- 
cidn del examinador acerca de las puntuaciones 
de prueba: las normas y la confiabilidad. En la 
mayor parte de los casos, las puntuaciones en 
pruebas psicoldgicas se interpretan con referen¬ 
da a normas basadas en la distribucidn de las 
puntuaciones obtenidas por una muestra repre- 
sentativa de personas examinadas. En el tema 
3A, Normas y estandarizacidn, se revisa el pro- 
ceso dc estandanzacidn de una prueba contra 


un grupo normativo apropiado, de modo que 
los usuarios de la prueba puedan dark sentido 
a las puntuaciones individuates en esa prueba. 
Dado que la utilidad de una puntuacidn de pruc- 
ba tambiln se determina por la consistencia o 
replicabilidad de los resultados de la misma, se 
introducen los aspectos esenciales de la teorfa 
sobre confiabilidad y medicidn en el tema 3B, 
Conceptos de confiabilidad. El siguiente capf¬ 
tulo se origina Idgicamente del material presen- 
tado aquf e investiga los complejos problemas 
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sobre validez —y,una prucba midc lo que sc su- 
pone que mida? Primero, se comienza con los 
problemas mds directos accrca del estableci- 
miento de un marco de referencia comparativo 
(normas) y la dcterminacidn de la consistencia 
o replicabilidad de los resultados de prueba 
(confiabilidad). 

Por lo general, el resultado inicial de las 
pruebas es una puntuacidn natural como el nu- 
mero total de afirmaciones de pcrsonalidad rc- 
frendadas en una direccidn en particular o el 
numero total de problemas resueltos corrccta- 
mente, quizd con la adicidn de puntos bonifi- 
cados por las soluciones rdpidas. En la mayor 
parte de los casos, esta puntuacidn inicial es 
imitil en sf misma. Para que los resultados de 
prueba tengan significado, los examinadores 
deben ser capaces de convertir la puntuacidn 
inicial a alguna forma de puntuacidn derivada 
que se base en la comparacidn con un grupo 
normativo o de estandarizacidn. Gran parte de 
las pruebas se interpreta al comparar los resul¬ 
tados individuates con el desempefio del grupo 
normativo; las pruebas referidas a criterio, que 
se analizan mds adelante, constituyen una ex- 
cepcidn. 

Un grupo normativo consiste en una 
muestra de personas examinadas que son re- 
presentativas de la poblacidn hacia la cual se 
dirige la prueba. Considdrese una prueba del 
conocimiento de vocabulario, disefiada para 
utilizarse con futuros estudiantes universitarios 
de primer grado. En estc caso, podrfan recolec- 
tarse los resultados del desempefio de una mues- 
tra grande, hetcrogdnea y nacional de dichas 
personas, con propdsitos de estandarizacidn. El 
objetivo esencial de la estandarizacidn de una 
prueba consiste en determinar la distribucidn 
de las puntuaciones naturales en un grupo nor¬ 
mativo, de modo que quienes dcsarrollan la 
prueba tengan la posibilidad de publicar las 
puntuaciones derivadas conocidas como normas. 
Como se analizard mas adelante, las normas se 
encuentran en muchas variedadcs; porejcmplo, 
rangos percentiles, equivalentes poredad, equi- 
vaientcs de grado o puntuaciones estdndar. En 
general, las normas indican la posicidn que 
tiene un individuo dentro de la prueba, en rela- 


cidn con el desempefio de otras personas de la 
misma edad, grado escolar, sexo y otras variables. 

Para ser efectivas, las normas deben obte- 
nerse con gran cuidado y construirse segun los 
precept os ya conocidos que se analizan despuds; 
lo que es mds, pueden volvcrsc anticuadas en 
s6lo unos cuantos ados, de modo que la regia, 
mds que la excepcidn, debe ser el estableci- 
miento periddico de nuevas normas (ejemplo 
dc caso 3-1). El tema de las normas sc enfoca de 
manera indirecta, ya que primero se le propor- 
ciona al lector un andlisis sobre las puntuacio¬ 
nes naturales y despuds se revisan los conceptos 
estadfsticos esenciales para una comprensidn 
de las normas. 

88 PUNTUACIONES NATURALES 


El nivcl mds bdsico de informacidn proporcio- 
nada por una prueba psicoldgica es la puntua- 
ci6n natural. Por ejemplo, en una prueba de 
personalidad, con frecuencia la puntuacidn na¬ 
tural es el numero de preguntas respondidas en 
la direccidn codificada para una escala espe- 
cffica. En las pruebas dc capacidad, por lo co- 
mun la puntuacidn natural se integra del numero 
dc problemas respondidos de manera correcta, 
al que con frecuencia se le suman los puntos 
bonificados por el desempefio rdpido. Asf, el 
resultado inicial de la prueba es casi siempre 
una suma numdrica, como 17 de 44 reactivos 
totales respondidos en la direccidn codificada 
en una escala de deprcsidn, o 29 de 55 puntos 
de puntuacidn natural obtenidos en la subes- 
cala de Disefio con Cubos de una prueba de 
inteligencia. 

Sin embatgo, deberfa ser obvio para el lec¬ 
tor que las puntuaciones naturales, por sf solas 
carecen absolutamente dc significado. Por ejem¬ 
plo, j,de qud sirve conocer que una persona re¬ 
sol vi6 de manera correcta 12 de 20 preguntas 
de razonamiento abstracto? /.Qud significado 
tiene que un examinando haya respondido en 
la direccidn codificada a 19 de 33 preguntas dc 
verdadero-falso de una escala de disposicidn 
psicoldgica? 
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EjEMPLODE CAS0 3-1 

PRUEBAS ANTI CU AD AS Y NORMAS OBSOLETAS_ 

Un psic6logo consullor trabajaba en un sistema da educaclin secundaria quo alardoaba de un 
respetado programs para nirios dolados y talentosos. Ei ingreso a este programs podfa oblenerse 
de diversas maneras, Incluyendo la documenlacidn por parte de un psicdlogo de que el solicllan- 
te lonfa un Cl de 130 o mayor. Los funclonarios de la escuela se sorprendleron cuando el numero 
de estudiantes aceplados aumenld de manera abrupta a inldos del decenio de 1980. La mayo* 
rla de los rocldn encontrados estudiantes con alio Cl habfan pasado por una prueba con un 
pslc6logo educalivo, quien era una persona honrada y competente que no tenia una aparente 
motivacidn para lalsear los resultados. El director de la escuela comentd con el pslcdogo consullor 
que la comunidad parecla estar fomentando una proporcidn cada vez mayor de estudiantes 
dotados y talentosos. Cuando se le preguntd qu6 pruebas estaban utilizando para la seleccldn al 
programa, el director responds que el WAIS (Wechsler, 1955) era el Instrumento para los 
estudiantes mayores. 

El consullor sefta!6'f]ue 6sla habfa sido una buena prueba en su tlempo, pero que ya habla 
pasado por una revision (el WAIS-R se publlcd on 1981) y que sus normas anterlores ya no eran 
pertinentes. De hecho, el WAIS es mucho m6s (dell que su revision (Kaufman, 1990; Mlshra y 
Brown, 1983) y tlende a producir un Cl que es jhasta 8 puntos mds allot No es sorprendente que 
tantos estudiantes hayan obtenido un Cl superior. El efecto de utilizar una prueba obsolete era 
que, en promedio, se sumaban 8 puntos al Cl real de cada solicitante. Al escuchar eslos datos, 
el director determlnO comprar una copla del WAIS-R, de modo que el psIcOlogo de la escuela 
pudiera tener un instrumento actualizado, con normas apropladas, para evaluar a los sollcltantes 
del programa especial. 


Incluso cs diffcil pensar sobre dichas pre- 
guntas sin recurrir a comparaciones de una va- 
riedad u otra. Se desea saber la manera en que 
otras personas han respondido a estas pruebas, 
si las puntuaciones observadas son altas o ba- 
jas en comparacidn con un grupo representative 
de sujetos. En el caso de pruebas de capacidad, 
se tiene curiosidad de saber si las preguntas 
fueron fdcilcs o diffeiles, en especial en rela- 
cion con la edad del sujeto. 

De hecho, parecc casi trivial que una pun- 
tuacidn natural adquiera significado principal- 
mente en rclacidn con las normas, un marco de 
referencia establecido de manera independien- 
te que se deriva de una muestra de estandariza- 
ciOn. Posteriormente se ampliard mds acerca de 
la derivaciOn y cl uso de las normas. Por ahora 
bastard con saber que las normas se establecen 
de modo empfrico, a traves de la aplicacidn de 
la prueba a una muestra grande y representati- 


va de personas. Dcspuds se compara la pun- 
tuacidn del examinado con la distribucidn de 
puntuaciones obtenidas por la muestra de es- 
tandarizacidn. Asf, se determina, a partir de las 
normas, si una puntuacidn obtenida es baja, 
promedio o alta. 

La gran parte de las pruebas psicoldgicas 
se interpreta a travds de la consulta de normas; 
como ya se sefiald, estos instrumentos se deno- 
minan pruebas referidas a la norma. Sin em¬ 
bargo, se recuerda al lector que existen otros 
tipos de instrumentos. En particular, las prue¬ 
bas referidas a criterio ayudan a determinar 
si una persona puede alcanzar un criterio ob- 
jetivamentc definido, como la suma de pares 
de numeros de dos dfgitos con una precisidn de 
97%. En el caso de las pruebas referidas a cri¬ 
terio, las normas no son esenciales. Al final de 
este tema se explicar&n con m£s detalle estas 
pruebas. 
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Existen diferentes tipos de normas. pcro 
dstas tiencn una caracterfstica en comun: cada 
una incorpora un resumen estadfstico de un 
cnormc conjunto de puntuaciones. Asf, para 
comprenderlas, el lector necesita dominar la 
estadfstica descriptiva elemental. En esle pun- 
to se hace un modesto pardntesis para revisar 
los conceptos estadfsticos esenciales. 

I CONCEPTOS ESTADIST1COS 
ESENCIALES 


Supdngase por el momcnto que se tiene acceso 
a una prueba de vocabulario de alto nivel, apro- 
piada para examinar las habilidades verbales 
de profesores universitarios y otros profcsio- 
nales (Gregory y Gemert, 1990). La prueba es 
un cuestionario de opcidn multiple con 30 pa- 
labras diffciles como firmaniento, paradisiaco 
y melifluo. Una profesora toma la prueba y elige 
la altemativa correcta para 17 de las 30 pala- 
bras. Pregunta cdmo se compara su calificacidn 
con otras personas con el mismo nivel acadd- 
mico. ^Cdmo podrfa responderse a su pregunta? 

Una manera de responder a la intcrrogante 
consistirfa en darle una lista de las puntuacio¬ 
nes naturales de la muestra preliminar de 
estandarizacidn con 100 profesores represen- 
tativos de su universidad (cuadro 3-1). Sin 
embargo, incluso con csta muestra normativa 
relativamentc pequefta (lo tfpico son miles de 
individuos), la lista de puntuaciones de prueba 
es un despliegue excesivo. 

Cuando se nos confronts con un conjunto 
de datos cuantitativos, la tendencia humana na¬ 
tural es la de resumir, condensar y organizar 
dichos datos en patrortes significativos. Por ejem- 
plo. en la evaluacidn del significado de la pun- 
tuacidn de vocabulario de la profesora, el lector 
podrfa calcular la puntuacidn promedio de toda 
la muestra o establecer la posicidn relativa de la 
puntuacidn de la profesora (17 respuestas co- 
rrectas) entrc los 100 datos encontrados en cl 
cuadro 3-1. En las siguientes secciones se re- 
visardn dstos y otros enfoques para la organi- 
zacidn y resumen de datos cuantitativos. 


Cuadro 3-1. Puntuaciones naturales 
de 100 profesores en una prueba de 
vocabulario con 30 reactivos 


6. 

10, 

16. 

16, 

17. 

14. 

19, 

14, 

16. 

15 

17, 

17, 

19. 

20, 

20, 

22. 

17. 

24, 

14. 

25 

13, 

20. 

11, 

20, 

21. 

11. 

20, 

16. 

18. 

12 

13, 

7. 

20, 

27, 

21. 

7. 

15. 

18, 

18. 

25 

20, 

27. 

28, 

13. 

21. 

17, 

12. 

18. 

12. 

15 

9. 

24. 

25, 

9. 

17, 

17. 

9. 

19. 

24. 

15 

20, 

21. 

22. 

12. 

21. 

12. 

19. 

19. 

23. 

16 

8. 

12. 

12 , 

17. 

13, 

19. 

13, 

11. 

16, 

16 

7. 

19. 

14. 

17. 

19, 

14, 

18. 

15. 

15, 

15 

14. 

14. 

17. 

18. 

18, 

22. 

11. 

15. 

13, 

9 


Fuonto: Bassdo en datos de Gregory. R. J y Gernetl, C. H 
(1990) Age trends lor fhM and crystallized irtioiilgence In an able 
subpopulalion Manuscrilo sin publlcar 


distribuci6n de frecuencias 

Una manera simple y util de resumir los datos 
consiste en tabular una distribucidn de frc- 
cuencias (cuadro 3-2), la cual sc prepara al 
especificar un pequeno numero de intervalos 
de clase de igual tamafio y despuds determinar 
cuantas puntuaciones caen dentro de cada in- 
tervalo. La suma de las frecuencias de lodos 
los intervalos ser& igual a N, el numero total de 


Cuadro 3-2. Distribucidn de frecuencla 
de las puntuaciones de 100 profesores 
en una prueba de vocabulario 

Intervalo de clase Frecuencla 


4-6 

1 

7-9 

8 

10-12 

12 

13-15 

21 

16-18 

24 

19-21 

21 

22-24 

7 

25-27 

5 

28-30 

1 


A/= 100 










F 
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puntuaciones en la muestra. No existe una re¬ 
gia simple para determinar el tamano de los in- 
icrvalos; 6ste, obviamente, depende del numero 
de intervalos deseado. Es cornu n que la distri- 
bucidn de frecuencias tenga entre 5 y 15 inter¬ 
valos de clase. En el caso del cuadro 3-2 cxisten 

9 intervalos de clase con 3 puntuaciones cada 
uno. El cuadro indica que un profesor obtuvo 
una calificacidn de 4,5 o 6; 8 profesores obtu- 
vieron 7, 8 o 9, y asf sucesi vamcntc. 

Un histograma proporciona una represen- 
tacidn grdfica de la misma informacidn contc- 
nida en la distribucidn de frecuencias (figura 
3-1 A). El eje horizontal representa las puntua¬ 
ciones agrupadas en intervalos de clase, mien- 
tras el eje vertical representa el numero de 
puntuaciones que caen dentro de cada interva- 

10 de clase. En un histograma, la altura de una 
columna indica el numero de puntuaciones que 
ocurrcn dentro de ese intervalo. Un polfgono 
de frecuencias es similar a un histograma, ex- 
cepto que la frecuencia de los intervalos de clase 
sc representa con puntos en lugar de columnas. 
Dcspu6s, los puntos independientes se unen por 
medio de lfncas rcctas (figura 3-1B). 

Las grdficas que se muestran en las figuras 
3-1 constituyen resumencs visuales de los 100 
datos en puntuacidn natural de la muestra de 
profesores. Ademds de estos resdmenes visua- 



Punluaclonos on prueba do vocabulario 


Figura 3-1 A. Histograma que representa las puntua¬ 
ciones en prueba de vocabulario do 100 profesores. 



Figura 3-1B. Polfgono de frecuencias de las puntua¬ 
ciones en prueba de vocabulario de 100 profesores. 

les, tambidn es posible producir rcsumcnes nu- 
mdricos mediante el cdlculo de los indices de 
tendencia central y dispersidn. 

MEDIDAS DE TENDENCIA CENTRAL 

4 ,Se puede establecer una sola puntuacidn re- 
presentativa de las 100 puntuaciones de voca¬ 
bulario en nuestra muestra? La media (X) o 
promedio aritmdlico es una de dichas puntua¬ 
ciones. Se calcula sumando todas las pun¬ 
tuaciones y divididndolas entre N, el numero 
de puntuaciones. Otro fndice dtil de tendencia 
central es la mediann, la puntuacidn que se 
cncuentra a la mitad cuando se han ordenado 
todas las puntuaciones. Si el numero de pun¬ 
tuaciones es par, la mediana es cl promedio de 
las dos puntuaciones a la mitad. En cualquicr 
caso, la mediana es cl punto que divide en dos 
la distribucidn, de modo que la mitad de los 
casos se encuentren por encima de ella y la 
mitad por debajo. Por ultimo, la moda es sim- 
plemente la puntuacidn que ocurre con mayor 
frecuencia. Si dos puntuaciones tienen la ma¬ 
yor frecuencia de ocurrencia, se dice que la dis- 
tribucidn es bimodal. 

La media de las puntuaciones enumeradas 
en el cuadro 3-1 es 16.8; la mediana y la moda 
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son 17. En este caso. las tres mcdidas de ten- 
dencia central tienen muy buena concordancia. 
Sin embargo, no siempre ocurre asf. La media 
es sensible a los valores extremos y puede ser 
engaiiosa si una distribucidn tiene pocas pun- 
tuaciones inusualmente altas o bajas. Conside- 
rese el caso extremo donde nueve personas 
ganan $10 000.00 y una ddcima persona gana 
$910 000.00. El ingreso promedio para este 
grupo de personas serfa de $100 000; sin em¬ 
bargo, este nivel de ingresos no es tfpico de 
nadie dentro del grupo. La mediana del ingre¬ 
so, colocada en $10 000, es mucho mds repre- 
sentativa. Por supuesto, dstc es un ejemplo 
extremo, pero ilustra un punto en general: si 
una distribucidn estd sesgada (es decir, es 
asimdtrica), la mediana es un mejor fndice de 
la tendencia central que la media. 

MEDIDAS DE VARIABILIDAD 

Dos o mis distribuciones de puntuaciones de 
prucba pueden tener la misma media y, sin em¬ 
bargo, es posible que difieran en gran medida 
en el grado de dispersidn de las puntuaciones 
con respecto a la media (figura 3-2). Para des¬ 
cribe el grado de dispersidn, es necesario un 


u> 


(b) 



Figura 3-2. Tres distribuciones con medias iddntlcas, 
pero con diferente variabilidad. 


fndice estadfstico que exprese la variabilidad de 
las puntuaciones en una distribucidn. 

El fndice estadfstico de variabilidad que se 
utiliza con mayor frecuencia en un grupo de 
puntuaciones es la desviacidn estdndar, sim- 
bolizada cr y abreviada DE. Desdc un punto de 
vista conceptual, el lector nccesita saber que la 
DE refleja el grado de dispersidn en un grupo 
de puntuaciones. Si dstas se encuentran agru- 
padas estrechamente cerca de un valor central, 
la DE es pequcfia. De hecho, en el caso extremo 
donde todas las puntuaciones son iddnticas, la 
DE es exactamente cero. A medida que un 
grupo de puntuaciones sc dispersa mis, la DE 
se vuelve mis grande. Por ejemplo, en la figu¬ 
ra 3-2 la distribucidn a tendrfa la DE mis gran¬ 
de, la distribucidn c, la mds pequena. 

La desviacidn estdndar o o es, en tdrminos 
sencillos, la rafz cuadrada de la varianza, deno- 
minada a 2 . La fdrmula de la varianza es 

£(X-X)» 

(A/-1) 

donde £ significa “sumatoria de”, X representa 
cada puntuacidn individual. ^es la media de las 
puntuaciones y N es cl numcro total de puntua¬ 
ciones. Como lo sugiere el nombre, la varianza 
es una medida de variabilidad. Sin embargo, 
en general, los psicdlogos prcfiercn informar 
la desviacidn estdndar, que se calcula obtenicn- 
do la rafz cuadrada de la varianza. Por supuesto, 
la varianza y la desviacidn estdndar transmiten 
informacidn intercambiablc —una se puede 
calcular a partir de la otra, al elevar al cua- 
drado (la desviacidn estdndar para obtener 
la varianza) u obtener la rafz cuadrada (de la 
varianza para obtener la desviacidn estdndar). 
Sin embargo, la desviacidn estdndar es la me¬ 
dida preferida de varianza en las pruebas psi- 
coldgicas, debido a su relevancia directa para 
la distribucidn normal, como se analizard en la 
siguiente seccidn. 

DISTRIBUCION NORMAL 

El polfgono de frecuencia que se representa en 
la figura 3-IB es sumamente irregular en cuanto 
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a su forma, un hallazgo tfpico con los datos dc 
| a vida real quc sc basan en muestras peque- 
flas. sucederfa con la forma del polfgono 
dc frecuencia si se aumentara la magnitud de la 
muestra normativa y tambidn se incremental 
el numero de intcrvalos de clase al reducir su 
tamafio? Es posible que, a medida que se ana- 
den nuevos individuos a la muestra, la distribu- 
ci<5n dc puntuaciones se parezea cada vez mis 
a una curva simdtrica, definida matemdticamcn- 
te y en forma dc campana, denominada distri- 
bucion normal (figura 3-3). 

Los psicdlogos prefieren una distribucidn 
normal de puntuaciones dc prueba, aun cuando 
muchas otras distribuciones son tedricamente 
posibles. Por ejemplo, dentro de la esfera de po- 
sibilidadcs se encucntra la dislribucidn rectan¬ 
gular de puntuaciones de prueba -un numero 
igual de resultados en cada intervalo de clase. 
De hecho. muchos legos podrfan incluso preferir 
una distribucidn rectangular de puntuaciones 
de prueba, basados en la premisa equitativa de 
que las diferencias individuales serfan por ello 
me nos pronunciadas. Por ejemplo, una mayor 
proporci6n de personas obtendrfa puntuaciones 
en el rango superior si las pruebas psicoldgicas 
se conformaran a una distribucidn rectangular 
de puntuaciones, en vez de a una distribucidn 
normal. 

Entonces, <,por qud los psicdlogos prefie- 
ren una distribucidn normal de puntuaciones, 
aun hasta el punto de seleccionar reactivos de 
prueba que ayuden a producir este tipo de dis- 



Flgura 3-3. Curva normal y porcentaje de casos dentro 
de clertos intervalos. 


tribucidn en la muestra de estandarizacidn? 
Existen varias razones para ello, incluyendo las 
considcracioncs cstadfsticas y los datos empf- 
ricos. Aquf se hard un breve pardntesis para 
explicar la fascinacidn psicomdtrica con las dis¬ 
tribuciones normales. 

Una razdn por la quc los psicdlogos prefie¬ 
ren las distribuciones normales es quc la curva 
normal tiene caracterfsticas matemiticas utiles 
que forman la base para varios tipos de investi- 
gacidn estadfstica. Supongase que se tiene in¬ 
terns en determinar si los Cl promedio de dos 
grupos de personas fucron significativamcntc 
diferentes. Serfa apropiado utilizar una estadfs¬ 
tica inferencial como la prueba t para la dife- 
rencia entre medias. Sin embargo, muchas 
estadfsticas inferencialcs sc basan en la suposi- 
cidn de que la poblacidn subyacente de pun¬ 
tuaciones se distribuye dc manera normal, o 
muy cercano a ello. Asf, a fin de facilitar el uso 
de cstadfsticas inferenciales, los psicdlogos pre¬ 
fieren quc las puntuaciones de prueba en la 
poblacidn normal sigan una distribucidn nor¬ 
mal o casi normal. 

Otra base para preferir la distribucidn nor¬ 
mal es su precisidn matemitica. Dado que la 
distribucidn normal se define de manera preci- 
sa en tdrminos matemiticos, es posible calcu- 
larcon gran exactitud el irea bajo las diferentes 
regiones de la curva. Asf, una propiedad util dc 
las distribuciones normales es que el porcenta¬ 
je de casos que caen dentro dc un cicrto rango 
o m4s alia de un cierto valor sc conoce de ma¬ 
nera cxacta. Por ejemplo, en una distribucidn 
normal, tan sdlo 2.14% de las puntuaciones 
excederdn la media en dos desviaciones est£n- 
dar o m4s (figura 3-3). De la misma manera, se 
puede determinar que la gran parte de las pun¬ 
tuaciones —m5s de 68%— caen dentro del ran¬ 
go de una DE a partir dc la media, en cualquier 
direccidn. 

Una tercera base para preferir una distri- 
bucidn normal de las puntuaciones dc prueba 
es que, con frecuencia, la curva normal surge 
de manera espontdnea en la naturaleza. De 
hecho, los primeros investigadores sc impre- 
sionaron tanto con la universalidad dc la dis- 
tribucidn normal, que consagraron a la curva 
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normal como una ley de la naturaleza. Gallon 
(1888) escribid: 

Es la suprema ley de la sinrazdn. Cada vez que 
se controls una amplla muestra de elementos 
caOiicos y se les ordena segun su magnllud, re¬ 
sultan haber tenido latente todo el tiempo una 
Insospechada y belllslma forma de regularldad. 

Seguramente no existe una “ley de la naturale¬ 
za’' concemiente a la forma que deben asumir 
las distribuciones de frccuencia. Sin embargo, 
es cierto que muchas caracterfsticas humanas 
importantes —tanto ffsicas como mentales— 
producen una estrecha aproximacidn a la curva 
normal cuando se grafican las mcdidas de mues- 
tras grandes y hetcrogdneas. Por ejemplo, un 
hallazgo muy conocido es una curva de distri¬ 
bucidn casi normal para las caracterfsticas ffsi¬ 
cas como peso, cstalura y tamano del ccrebro 
at momento del nacimiento (Jensen, 1980). 

Tambidn se encuentra una distribuci6n 
aproximadamente normal en el caso de numc- 
rosas pruebas mentales, incluso con aqucllas 
que se construyeron totalmcntc sin referencia a 
la curva normal. Para ilustrar este punto, se hard 
referencia a las primeras pruebas disefiadas 


antes de la fijacidn psicomdtrica actual con la 
distribucidn normal. Wechsler (1944) eligid los 
reactivos de la Escala de Inteligencia Wechsler- 
Bcllevue original con base, principalmcntc, en 
la variedad de los tipos de reactivo, sin prestar 
atencidn a la distribucidn resultantc de las pun- 
tuaciones. De hecho, consideraba que la creencia 
de que las mcdidas mentales sc deben distri- 
buir por si mismas, segun la curva normal, era 
“equivocada". Sin cmbaigo, cuando grafted la 
distribucidn de los Cl Totales de su prueba, sur- 
gid la previsible distribucidn casi normal (figu- 
ra 3-4). Lindvall (1967) encontrd lo mismo 
cuando trazd la grffica de los datos de la Pintner 
Ability Test (Prueba de Capacidad de Pintner) 
de 1923. Por tanto, se ve que incluso en nuscn- 
cia de ajustcs psicomdtricos, la distribucidn de 
las puntuacioncs de una prueba mental cn las 
muestras de estandarizacidn se aproxima de 
manera tfpica a una curva normal. 

ASJMETRIA 

La asimetrfa se refierc a la simetrfa o asime- 
trfa de una distribucidn de frecuencia. Si las 
puntuaciones de prueba se agrupan hacia el 



Cocknile do intoiigencia 


Flgura 3-4. Distribucidn aproximadamente normal de 1 508 Cl Totales en la Escala Wechsler-Bellevue. 
Fuente: Reproducldo con autorizackSn de Wechsler. D. (1994). The measurement of adult intettigence (3a. edicldn). 
Baltimore: Williams y Wilkins. 
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extremo inferior de la escala, se dice que la dis- 
tribucidn ticne una asimetrfa positiva. En el caso 
opuesto, cuando las puntuaciones de prueba 
se agrupan cn el extremo superior de la escala, se 
dice que la distribucidn cs asimdtrica negativa- 
mente (figura 3-5). 

En pruebas psicoldgicas, las distribuciones 
asimdtricas significan, por lo general, quequien 
desarrolld la prueba ha incluido muy pocos 
reactivos ficiles o muy pocos reactivos diffci- 
|es. Por ejemplo, cuando las puntuacioncs cn la 
muestra de estandarizacidn sc acumulan cn el 
extremo inferior (asimetrfa positiva), es proba¬ 
ble que la prueba contenga muy pocos reactivos 
ficiles como para discriminar de mancra efee- 
tiva cn este extremo de la escala. En este caso, 
los individuos que obticnen punluaciones de 
cero o casi ccro, en realidad podrfan diferir con 
respecto a la dimensidn medida. Sin embargo, 
la prueba no puede detectar estas difcrencias, 
dado que la mayor parte de los reactivos son 
demasiado diffeiles para estas personas. Por 




a) Asimetrfa negativa 

b) Asinvetr fa positiva 


Figura 3-5. Curvas Asimetricas de distribucldn. 


supuesto, tambidn ocurre el patrdn contrario. 
Si las puntuaciones se agrupan al extremo su¬ 
perior (asimetrfa negativa), es probable que la 
prueba contenga muy pocos reactivos diffeiles 
como para lograr discriminaciones cfcctivas en 
este extremo de la escala. 

Cuando la investigacidn inicial indica que 
un inslrumento produce resultados asimdlricos 
en la muestra de estandarizacidn, por lo comun. 
los autores reforman la prueba a nivel de los 
reactivos. La solucidn mis directa consiste en 
ahadir reactivos o modificar los existentes, de 
modo que la prueba tenga mis reactivos ficiles 
(para rcducir la asimetrfa positiva) o mis diff¬ 
eiles (para rcducir la asimetrfa negativa). Si cs 
demasiado tardc para revisar el inslrumento, el 
autor de la prueba puede utilizar una (rans r or- 
macidn estadfstica para ayudar a producir una 
distribucidn mis normal de puntuaciones (vda- 
se despuds). Sin embargo, la estrategia preferi- 
da consiste en revisar la prueba, de modo que 
la asimetrfa sea minima o inexistente. 


B transformaci6n de las 

PUNTUACIONES NATURALES 


Darle sentido a los resultados de prueba es, en 
gran medida, una cuestidn de transformar las 
puntuaciones naturales en formas mis interpre¬ 
tables y utiles de informacidn. En el anilisis 
anterior acerca de las distribuciones normales, 
sc insinuaron las transformaciones al mostrar 
la mancra en que el conocimiento sobre la me¬ 
dia y la desviacidn cstindar de dichas distribu¬ 
ciones pueden ayudar a determinar la posicidn 
rclativa de una puntuacidn individual. En esta 
seccidn se continuari con este tema de una 
manera mis directa, al presentar los requisitos 
formales para varios tipos de transformaciones 
de las puntuaciones naturales. 


PERCENTILES Y RANGOS PERCENTILES 

Un percentil expresa el porcentaje de perso¬ 
nas dentro de la muestra de estandarizacidn que 
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obtuvieron puntuaciones por debajo de una pun¬ 
tuacidn natural especffica. Por cjcmplo, en la 
prueba de vocabulario reprcsentada en el cua- 
dro 3-2, 94% de la muestra se colocd por de¬ 
bajo de la puntuacidn natural de 25. Asf, una 
puntuacidn natural de 25 corresponded a un 
percentil 94, indicado con P v Obsdrvese que 
los percentiles mis altos indican puntuaciones 
mis alias. En el caso extrcmo. un individuo 
examinado quc haya obtenido una puntuacidn 
natural que excediera a todas las puntuaciones 
en la muestra de cstandarizacidn rccibirfa un 
percentil de 100 o /> . 

Se advierte al lector que no debe confun- 
dir los percentiles con el porcentaje de rcspues- 
tas correctas. Rccudrdese que un percentil 
indica sdlo cdmo se compara a un individuo 
con la muestra de estandarizacidn y no trans¬ 
mite el porcentaje de preguntas respondidas de 
manera correcta. Es posible que, en una prue¬ 
ba diffcil, una puntuacidn natural de 50% dc 
respuestas correctas podrfa traducirse a un 
percentil 90. 95 o incluso 100. A la inversa, en 
una prueba ficil, una puntuacidn natural de 95% 
de respuestas correctas podrfa traducirse a un 
percentil 5, 10 o 20. 

Los percentiles tambidn pueden concebir- 
se como rangos en un gnipo de 100 sujetos re¬ 
presentatives, donde 1 es el rango inferior y 100 
cl superior. Obsdrvesc que los rangos percen¬ 
tiles son el re verso completo de los procedi- 
mientos comunes de clasificacidn por rangos. 
Un rango percentil (RP) de 1 se encuentra en el 
extremo inferior de la muestra, mientras quc 
un RP de 99 se encuentra cerca del tope. 

Un percentil 50 (P^) correspondc a la me¬ 
dians o puntuacidn natural a la mitad de la dis- 
tribucidn. Un percentil 25 (/»„) con frecuencia 
se denomina Q\ o primer cuartil, debido a que 
una cuarta parte de las puntuaciones cae por 
debajo de ese punto. De la misma manera, un 
percentil 75 (P^) se indica como Q3 o tercer 
cuartil, debido a que tres cuartas partes de las 
puntuaciones caen por debajo de esc punto. 

Los percentiles son ficiles de calcular y son 
intuitivamente atractivos para los legos y pro- 
fcsionales por igual. Por tanto, no es dc sor- 
prender quc los percentiles sean el tipo mis 


comun de transformacidn de las puntuaciones 
naturales que se encuentra en las pruebas psi- 
coldgicas. Casi cualquier tipo de resultados de 
prueba se puede presentar como percentiles, 
incluso cuando otras transformaciones son la 
meta principal de la prueba. Por ejemplo, las 
pruebas de inteligencia se utilizan para obtener 
puntuaciones de Cl —un tipo de transforma¬ 
tion que se analiza adelante— pero tambi6n 
producen puntuaciones en percentil. Asf, un Cl 
de 130 corresponde a un percentil 98, lo cual 
significa quc la puntuacidn no sdlo sc encuentra 
muy por encima del promedio sino, de mane¬ 
ra mis precisa, que supera a 98% de la muestra 
de estandarizacidn. 

Las puntuaciones percentiles tienen un gra¬ 
ve inconveniente: distorsionan la escala de 
medicidn subyacente, en especial en los extre- 
mos. Un ejemplo especffico serviri para acla- 
rar este punto. Considdrcse un caso hipotdtico 
donde cuatro personas obtienen los siguientes 
percentiles en una prueba: 50,59,90 y 99. (Re- 
cudrdc.se que aquf se esti hablando de percen¬ 
tiles, no del porcentaje de respuestas correctas.) 
Las primeras dos personas difieren en 9 puntos 
percentiles (50 contra 59), al igual que las ulti¬ 
mas dos personas (90 contra 99). El observador 
no entrenado podrfa suponer, falsamente, que 
las primeras dos personas difirieron en la mis¬ 
ma cantidad en cuanto a la puntuacidn natural 
subyacente quc las ultimas dos. Una inspeccidn 
de la figura 3-6 rcvela la falacia de esta suposi- 
cidn. La diferencia en puntuacidn natural sub¬ 
yacente entre los percentiles 90 y 99 es mucho 
mayor que entre los percentiles 50 y 59. 

PUNTUACIONES ESTANDAR 

Aunque los percentiles son el tipo mis popular 
de puntuacidn transformada, las puntuaciones 
estindar ejemplifican las propiedades psicomd- 
tricas mis deseables. Una puntuacidn estindar 
utiliza la desviacidn estindar dc la distribucidn 
total de puntuaciones naturales como la unidad 
fundamental de medida. La puntuacidn estin¬ 
dar express la distancia de la media en unidades 
de desviacidn estindar. Por ejemplo, una pun- 





r 


Normas y contiabilldad • 79 



dllerencia on punluaciones dtferencia en puntuaciones 
naturales onlre tos rangos naturales entro los tangos 
petceritilar tie 50 a 59 percentllar de 90 a 99 


Flgura 3-6. Rangos percentiles en una dlstrlbuclbn 
normal. 


Cuadro 3-3. Cdlculos de las 
puntuaciones estdndar en una 
prueba hipotetica 


Para la muostra norma tiva: X = 60, DE- 8 

X-X 

PuntuackSn estdndar = 7 =- 

DE 


Persona A: puntuac*6n natural de 35 (debajo del promo- 
dlo) 


35-50 

7 =- 

8 


= - 1.88 


Persona B: puntuacidn natural de 50 (exactamenle pro- 
medio) 


7 = 


50-50 

8 


0.00 


tuaci6n natural que sc encucntra exactamentc a 
una desviacidn estdndar por encima de la me¬ 
dia se convierte en una puntuacidn cstandar de 
+1.00. Una puntuacidn natural quc se encuen- 
tra exactamente a la mitad de una desviacidn 
estdndar por debajo de la media, se convierte 
en una puntuacidn cstandar de -0.50. Asf, una 
puntuacidn estdndar no s6lo expresa la magni- 
tud de la desviacion con respecto a la media, 
sino tambidn la direccidn de esa desviacidn (po- 
sitiva o negativa). 

El cdlculo de la puntuacidn estdndar de un 
individuo (tambidn llamada puntuaeion z) es 
sencillo: se resta la puntuacidn natural de la 
persona examinada a la media del grupo norma- 
tivo y despuds sc divide esta diferencia entre la 
desviacidn estdndar del grupo normativo. El 
cuadro 3-3 ilustra el cdlculo de las puntuacio¬ 
nes z de tres sujetos con una capacidad suma- 
mcnte variable en una prueba hipotdtica. 

La puntuacidn estdndar posee la propiedad 
psicomdtrica deseable de conservar las magni¬ 
tudes relativas de distancia entre los valores 
sucesivos, encontradas entre las puntuaciones 
naturales originales. Eslo se dcbc a que la dis- 
tribucidn de las puntuaciones estdndar tiene la 
misma forma que la distribucidn de las puntua¬ 
ciones naturales. Como consecuencia, el uso de 
las puntuaciones estdndar no distorsiona la cs- 
cala de medida subyacente. Esta ftdelidad de la 


Persona C: puntuacibn natural de 70 (por endma del 
promedlo) 


escala de mcdicidn transformada es una de las 
principales ventajas de las puntuaciones 
estdndar, por encima de los percentiles y de los 
rangos percentiles. Como se scfiald antes, las 
puntuaciones percentiles distorsionan en gran 
medida los datos, en especial a los extremos. 

Un ejemplo especffico servird para ilustrar 
estc aspecto no distorsionante de las puntua¬ 
ciones estdndar. Considdrense cuatro pun¬ 
tuaciones naturales de 55, 60, 70 y 80 en una 
prueba con una media de 50 y desviacidn 
estdndar de 10. Las primeras dos puntuaciones 
difieren en cinco puntos de puntuacidn natural, 
mientras las ultimas dos difieren en 10 puntos 
de puntuacidn natural —dos veces la diferen¬ 
cia del primer par. Cuando las puntuaciones 
naturales se convierten a puntuaciones estdndar, 
los resultados son +0.50, +1.00, +2.00 y +3.00, 
respectivamenle. El lector observard que las 
primeras dos puntuaciones difieren en 0.50 des- 
viaciones estdndar, mientras las ultimas dos di¬ 
fieren en 1.00 desviaciones estdndar —dos 
veces la diferencia del primer par. Asf, las 
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punluaciones estdndar siemprc conscrvan la 
magnitud relativa de diferencia que se encuen- 
tra en(rc las punluaciones naturales originates. 

Las distribucioncs dc puntuacidn estdndar 
poscen importantes propiedades psicometricas 
que no existcn en las distribuciones de puntua- 
cidn natural. Cuando cada una de estas pun¬ 
luaciones en una distribuci6n se transforman a 
una puntuacidn estandar, el conjunto resultante 
de punluaciones estdndar siempre tiene una me¬ 
dia de cero y una varianza de LOO. Dado que 
la desviacidn estdndar es la rafz cuadrada dc la 
varianza, la desviacidn estdndar de las puntuacio- 

ncs estdndar (^1.00) es necesariamente LOO. 

Una razdn para transformar las puntuaciones 
naturales en puntuaciones estdndar consiste en 
reprcsentar los resultados de pruebas diferen- 
tes scgiin una escala comun. Si dos distribucio¬ 
nes dc puntuaciones de prueba poseen la misma 
fonna. se pueden hacer comparaciones directas 
de las puntuaciones naturales al transformarlas 
en puntuaciones estdndar. Supdngase, porejem- 
plo, que un estudiante de primer ingreso a la 
universidad obtuvo 125 puntos en puntuacidn 
natural en una prueba de pensamiento espacial. 
donde la muestra normativa tuvo un promedio 
de 100 puntos (con DE dc 15 puntos). Adc- 
mds, supdngase que obtuvo 110 puntos en pun- 
tuacion natural en una prueba de vocabulario 
donde la muestra normativa tuvo un promedio 
de 90 puntos (con DE de 20 puntos). ^En cudl 
area de habilidad muestra mayor aptitud, pen¬ 
samiento espacial o vocabulario? 

Si las muestras normativas de ambas prue¬ 
bas produjeron distribuciones de puntuaciones 
de la misma forma, se pueden comparar las pun¬ 
tuaciones de pensamiento espacial con las de 
vocabulario al convcrtirlas en puntuaciones 
estdndar. La puntuacidn estdndar del estudian¬ 
te en pensamiento espacial es (125— 100)/15 o 
+1.67, mientras que su puntuacidn estdndar cn 
vocabulario es (110-90)/20 o +1.00. En rela- 
ci6n con las muestras normativas, cl estudiante 
tiene mayor aptitud para pensamiento espacial 
que para vocabulario. 

Pero es apropiado hacer una advertencia 
con respecto a la comparacidn de puntuacio¬ 
nes estdndar de dos distribuciones difercntes. 


Si dstas no tienen la misma forma, las compa¬ 
raciones de puntuaciones estdndar pueden ser 
muy enganosas. Se ilustra este punto con la fi¬ 
gure 3-7, que nepresenta dos distribuciones: una 
es notablemente asimdtrica, con una puntuacidn 
promedio de 30 (DE de 10), y otra sc distribu- 
ye de mancra normal, con puntuacidn prome¬ 
dio de 60 (DE de 8). Una punluacidn natural 
de 40 en la primera prueba y una dc 68 en la 
segunda se traducen, ambas, a una puntuacidn 
estdndar de +1.00. Sin embargo, una punlua- 
cidn estdndar de 1.00 en la primera prueba se 
coloca por cncima de 92% de la muestra nor¬ 
mativa, mientras la puntuacidn estdndar equi- 
valente en la segunda prueba s61o estd por 
cncima de 84% de la muestra normativa. Cuan¬ 
do dos distribucioncs dc puntuaciones dc prue¬ 
ba no poseen la misma forma, las puntuaciones 
estdndar equivalentes no significan posiciones 
comparables dentro de las muestras normati¬ 
vas respectivas. 

PUNTUACIONES TY OTRAS 
PUNTUACIONES ESTAN DARiZADAS 

Muchos psicdlogos y educadores aprecian las 
propiedades psicomdtricas de las puntuaciones 
estdndar, pero consideran las fracciones deci- 
males y los signos positivos y negativos (p. ej., 
z = -2.32) como distracciones innecesarias. En 
respuesta a estas prcocupacioncs, los especia- 
listas en pruebas han disenado cierto numero 
dc variaciones para las puntuaciones estdndar 
que colectivamente se conoccn como puntua¬ 
ciones estandarizadas. 

Desde un punto de vista conceptual, las 
puntuaciones estandarizadas son iddnticas a 
las puntuaciones estdndar. Ambas contienen 
exactamente la misma informacidn. No se afec- 
ta la forma de la distribuci6n de puntuaciones 
y la relacidn enlre las puntuaciones estdndar y 
estandarizadas siempre se traza como una If- 
nea recta. Sin embargo, las puntuaciones cstan- 
darizadas siempre se expresan como numeros 
enteros positivos (no existen fracciones deci¬ 
mates ni signos negativos), de modo que mu¬ 
chos usuarios de prueba prefieren representar 
los resultados en esta forma. 
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Puntuaclonas nalurnlot -3.5 -3.0 -2.5 -2.0 -13 -1.0 -.5 0. +.5 +1.0 +13 +2.0 +2.5 +3.0 +33 0 1 


Flgura 3-7. Relaciones entro puntuaciones naturales, puntuaciones z y poslckin relative para dos dislriboctones 
notabiemente diferentes 


Las puntuaciones cstandarizadas eliminan 
las fracciones y los signos negativos al produ¬ 
ct valorcs diferentes a cero para la media y 1.00 
para la desviacidn estdndar de las puntuacio¬ 
nes transformadas. La media de las puntuaciones 
transformadas puede establecerse en cualquier 
valor conveniente como 100 o 500 y la desvia- 
ci6n estdndar en. digamos, 15 o 100. El punto 
importante acerca de las puntuaciones cstan¬ 
darizadas cs que se puede transformar cualquier 
distribucidn a una escala preferida con media y 
desviacirin estdndar predeterminadas. 

Un tipo muy conocido de puntuacidn estan- 
darizada es la puntuacidn T, que tiene una 
media de 50 y desviacidn estdndar de 10. Las 
escalas en puntuacidn T son especialmente co- 
munes en las pruebas de personalidad. Porejem- 
plo, en el MMPI, cada escala clfnica (como 
Depresidn, Paranoia) se convierte a una medi- 
da comun, donde 50 cs la puntuacidn prome- 
dio y 10 es la desviacidn estdndar de la muestra 
norma tiva. 

Para transformar las puntuaciones natu¬ 
rales en puntuaciones T se utiliza la siguientc 
fdrmula: 


El tdrmino (X-^/D£ es. por supuesto, equi- 
valente a z, de modo que se puede volver a es- 
cribir la ecuacidn para T como una simple 
transformacidn de z: 

r=i0z+50 

Para cualquier distribucidn de puntuaciones 
naturales, las puntuaciones T correspondientes 
tcndrdn un promedio de 50. Ademds, para la 
generalidad de las distribuciones, gran parte de las 
puntuaciones T caerdn entre los valores de 20 y 
80; es decir, dentro de tres desviaciones estdndar 
a partir de la media. Por supuesto, es totalmen- 
te posible que existan puntuaciones T fuera de 
este rango y, quizd, incluso son probables en 
poblaciones especiales. En entomos clfnicos, 
no es poco comun observar puntuaciones T muy 
altas —incluso tan alias como 90— en inven- 
tarios de personalidad como el MMPI. 

Las puntuaciones estandarizadas se pue- 
den adaptar para producir cualquier media y 










82 • Evaluation pslcologlca: Historla, principles y aplicaciones 


(Capitulo 3) 


desviacidn estdndar. Sin embargo, para climi- 
nar las puntuaciones estandarizadas negativas, 
la media preseleccionada debe scr cuando 
menos cinco veces tan grande como la desvia- 
cidn est&ndar. En la pr&clica, quienes desarro- 
llan pruebas dependen de unos cuantos valores 
preferidos para las medias y desviaciones 
csttindar de las puntuaciones estandarizadas, 
como se ejemplifica en el cuadro 3-4, 

PUNTUAQONES ESTANDAR 
NORMAUZADAS 

Como se sefiald antes, los psicdlogos y cduca- 
dores prcficrcn manejar distribuciones norma- 
les debido a que las propiedades estadfsticas 
de la curva normal son muy conocidas, y las 
puntuaciones estdndar de estas distribuciones 
se pueden comparar directamente. Quizes el 
lector se ha preguntado qud recurso se tiene 
disponible para el autor de una prueba que 
encucntra que 6sta produce una distribucidn 
asimdtrica de puntuaciones en la muestra nor- 
mativa. Por fortuna, las distribuciones de pun¬ 
tuaciones asimdtricas o que no son normales en 
otros sentidos pueden transformarse o norma- 
lizarse para cncajar con una curva normal. Aun- 
que los especialistas en pruebas ban disehado 
varios mdtodos para convertir una distribucidn 
no normal en normal, se analizard sdlo cl enfo- 
que mds popular—la conversidn de percentiles 
a puntuaciones cstdndar normalizadas. Por ex- 
trafio que parezea, es mis ficil explicar este 
enfoque si primero se describe el proceso con- 


trario, la conversidn de puntuaciones estindar 
a percentiles. 

Se ha serial ado que una distribucidn normal 
de puntuaciones naturales tiene, por definicidn, 
una forma especffica, definida en tdrminos 
matemiticos (figure 3-3). Ademis, se ha indi- 
cado que la transformacidn de un grupo de pun¬ 
tuaciones naturales a puntuaciones estindar 
conserva la forma original de una distribucidn. 
Por tanto, si un conjunto de puntuaciones natu¬ 
rales sc distribuye de manera normal, las pun¬ 
tuaciones estindar resultantes obcdccer&n 
lambien la curva normal. 

Tambidn se sabe que las propiedades ma- 
temiticas dc la distribucidn normal pueden 
calcularse de modo preciso. Sin entrar en deta- 
lles sobre el cilculo, deberfa ser obvio que sc 
puede determinar el porcentaje de casos que 
caen por debajo de cualquier puntuacidn estindar 
particular. Por ejemplo, en la figure 3-6, una 
puntuacidn est^ndar de -2.00 (designada como 
-2a) se encuentra por encima de 2.14% de los 
casos. Asf, una puntuacidn estdndar de -2.00 
corresponde al percenlil 2.14. De la misma for¬ 
ma, cualquier puntuacidn cstdndar posible pue¬ 
de expresarse en tdrminos de su percentil 
conespondiente. El Apdndice D enumera los 
percentiles para las puntuaciones estdndar y 
para varias otras puntuaciones transformadas. 

La obtencidn de puntuaciones cstandar 
normalizadas se logra mediantc el cdlculo in- 
verso. A saber, se utiliza el percentil de cada pun¬ 
tuacidn natural para determinar su puntuacidn 
estdndar correspondiente. Si se hace esto con 
todos y cada uno de los casos en una distribucidn 


Cuadro 3-4. Medias y desviaciones estdndar de puntuaciones 
estandarizadas comunes 


Tipo de medida 

Ejemplos especfficos 

Media 

Desviacldn 

estandar 

Cl Total 

WAIS-III 

100 

15 

Suboscalas de prueba de Cl 

Vocabulario. Oiseno con Cubes 

10 

3 

Escalas de Prueba de Personalidad 

Depreskin, Paranoia en el MMPI-2 

SO 

10 

Pruebas de aptitud 

Examen de Selecckin para el Posgra- 
do, Pruebas de Evaluacion Escolar 

500 

100 
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diferente a la normal, las puntuaciones estdndar 
resultantes se distribuirdn en forma normal. 
Obs^rvese que en dicha distribucidn nor- 
malizada de las puntuaciones estdndar, dichas 
puntuaciones no se obtienen de manera directa 
a parti r de la fdrmula normal para el cdlculo, 
sino que se determinan de modo indlrecto a tra- 
vds de calcular primcro el percentil y despuds 
obtencr la puntuacidn estdndar equivalente. 

La convcrsidn de percentiles a puntuacio¬ 
nes estdndar normalizadas podrfa parecercomo 
la solucidn ideal para el problema de los datos 
de prucba que no se ajustan a la norma. Sin 
embargo, existe un inconveniente potencial- 
mente serio: las puntuaciones estdndar norma¬ 
lizadas son una transformacidn no lineal de las 
puntuaciones naturales. Asf, las rclaciones ma- 
temdticas establecidas con las puntuaciones 
naturales pueden no resultar ciertas para las 
puntuaciones estdndar normalizadas. En una 
distribucidn notablemente asimdtrica, inciuso 
podrfa concebirse que una puntuacidn natural 
que se encuentre significativamente por deba- 
jo de la media tenga una puntuacidn estdndar 
normalizada que supere la media. 

En la prdctica, las puntuaciones estdndar 
normalizadas se utilizan pocas veces. Dichas 
transformacioncs son apropiadas s6lo cuando 
la muestra normativa es grande y rcpresentati- 
va y la distribucidn de puntuaciones naturales 
se aleja s6lo ligeramente de la curva normal. 
A propdsito, la causa mds probable para estas 
distribuciones no normales de las puntuaciones 
es el ni vel inapropiado de dificultad de los reac- 
tivos de prueba; por ejemplo, demasiados 
reactivos diffciles o fdciles. 

En este caso nos enfrentamos a una trampa 
sin salida, en cuanto a que las distribuciones 
que se alejan ligeramente de la curva normal 
no cambian en mucho cuando se les normaliza 
y, por tanto, se obtiene poco en el proceso. De 


manera irdnica, las puntuaciones estdndar nor¬ 
malizadas producen el mayor cambio cuando 
se trata de distribuciones que sc alejan mucho 
de la curva normal. Sin embargo, cuando la dis- 
tribucidn de puntuaciones naturales es de este 
tipo, quienes desarrollan pruebas harfan mejor 
en volver a la mesa de trabajo y ajustar el nivel 
de dificultad de los reactivos de prueba, de 
modo que produzcan una distribucidn normal, 
en lugar de sucumbir al arreglo estadfstico par- 
cial de las puntuaciones estdndar normalizadas. 

ESTANINAS, ESTENES Y ESCALA C 

Por ultimo, se hace una breve mencidn de tres 
transformaciones de puntuaciones naturales que 
tienen principalmente un interns histdrico. La 
Fuerza Adrea de EUA desarrolld la escala de 
estaninas (estdndar nueve) durante la segunda 
Guerra Mundial. En una escala de estaninas, 
todas las puntuaciones naturales se convierten 
a un sistema de un solo dfgito de puntuaciones 
que van de 1 a 9. La media de las puntuacio¬ 
nes de estaninas es siempre 5 y la desviacidn 
estdndar es aproximadamente 2. La transforma- 
cidn de puntuaciones naturales a estaninas cs 
simple: las puntuaciones se clasifican de mc- 
nor a mayor y 4% mds bajo de las puntua¬ 
ciones se convierte en una estanina de 1, el si- 
guiente 7% se convierte a una estanina de 2 y 
asf sucesivamente (vdase cuadro 3-5). La prin¬ 
cipal ventaja de las estaninas es que se restrin- 
gen a numeros de un solo dfgito. Esta era una 
cualidad considerable en la dpoca anterior a las 
computadoras modemas, cuando los datos se 
perforaban en tarjetas Hollerith que tenfan que 
ilevarse y almacenarse ffsicamentc en repisas. 
Dado que una estanina se podfa perforar en una 
sola columna, se requerfan muchas mcnos tar¬ 
jetas que si se ingresaran las puntuaciones na¬ 
turales originales. 


Cuadro 3-5. Porcentajes de la distrlbucidn para utilizarse 
en la conversidn a estaninas 

Porcentaio 4 7 12 17 20 17 12 7 4 

Estaninas 1 2 3 4S6789 
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Los cxpcrtos en estadfstica han propuesto 
diversas variaciones para el tema dc la escala 
de cstaninas. Canfield (1951) propuso la esca¬ 
la estenes de 10 unidades, con 5 unidades pot 
arriba y 5 por debajo de la media. Guilford y 
Fmchter (1978) propusieron la escala C, que 
consiste en 11 unidades. Aunque las estaninas 
aun tienen un amplio uso, variaciones como la 
escala estenes y la escala C nunca lograron gran 
interns por parte de los autores de pruebas. 

RESUMEN DE LAS NORMAS BASADAS 
EN ESTADfSTICAS 

Sc ha aludido en varias ocasiones la facilidad con 
la que las puntuaciones estdndar, puntuaciones 
T, estaninas y percentiles se pueden transfor- 
mar unas en otras, en especial si la distribucidn 


subyacentc de puntuaciones naturales se adap- 
ta a la curva normal. Dc hecho, la forma cxacta 
en la que se presentan las puntuaciones es, en 
gran medida, una cuestidn dc convencidn y pre- 
fercncia personal. Por ejemplo, un Cl de 115 
en el WA1S-I1I puede prcsentarse tambidn como 
una puntuacidn esUindar de +1.00 o una pun- 
tuacidn Tdc 60 o un rango pcrcentil 84. Todos 
estos resultados transmiten exactamentc la 
misma informacidn.* La figura 3-8 resume las 


* Un Cl de 115 en el WA1S-III lambt^n se puede cxprc- 
sar como una estanina dc 7 puntos. Sin embargo, cs 
ncccsario mencionar que sc pierdcn datos cuando se 
informa en cstaninas. Obs6rvcse que los Cl en cl rango 
de 111 a 119 se transforman todos en una estanina de 
7 puntos. Por tanto, si se dice sdlo que un indi viduo ha 
logrado una estanina de 7 puntos en una prueba de 
inteligcncia. no sc sabc el cquivalcntc cxacto en Cl. 
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Figure 3-8. Equivalences entre transformaciones comunes de las puntuaciones naturales en una distribuddn 
normal. 
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rclaciones quc cxisten entre las normas con 
base cstadfstica que se emplean dc modo mis 
comun. 

Esto termina la breve introducci6n a las 
muchas tdcnicas con las cuales se pueden resu- 
mir y transformar de manera estadfstica los da- 
tos de prueba de una muestra normative. Nunca 
sc debe perder de vista el principal propdsito 
de estas transmutaciones estadfsticas, es decir, 
el ayudar al usuario de prueba a darlc signifi- 
cado a una puntuacidn individual en relacidn 
con un grupo apropiado de comparacidn. 

Pero, iquf cs un grupo apropiado de com- 
paracidn? iQud caracterfsdcas se deben requerir 
en las personas dentro del grupo normati vo? 1C6- 
mo se debe elegir a estos individuos? ^Cuintas 
personas se necesitan? fist as son preguntas im- 
portantes que influyen sobre la pertinencia de 
los resultados de una prueba, de la misma ma¬ 
nera quc la seleccidn adecuada de los reactivos 
y los procedimientos cstandarizados de prue¬ 
ba. En lo que resla dc este tema, se analizarin 
los procedimientos implicados en la selcccidn 
de un grupo normativo. 


B SELECCION DE UN GRUPO 
NORMATIVO 


Cuando se clige un grupo normativo, quienes 
desarrollan pruebas se esfuerzan por obtener 
una muestra representativa de la poblacidn para 
la cual se disertd la prueba (Petersen, Kolen y 
Hoover, 1989). En teorfa, obtener un grupo 
normativo representative es simple y sencillo. 
Considerese una prueba de rendimiento escolar 
disenada para ninos de sexto grado de prima- 
ria en EUA. La poblacidn relacionada la cons- 
tiluyen todos los nifios en sexto grado, de costa 
a costa del pafs y en Alaska y Hawai. Se puede 
obtener una muestra representativa de estos in¬ 
dividuos potenciales a traves de un mucstreo 
alcatorio por computadora de aproximadamente 
10 000 ninos, entre los millones de ninos elegi- 
bles. Cada uno tendrfa igual probabilidad de ser 
elegido para realizar la prueba; es decir, la es- 
trategia de seleccidn seria un simple muestreo 


aleatorio. Los resultados de dicho muestreo 
constituirfan una fuente ideal para los datos 
normativos. Con una muestra aleatoria amplia, 
es casi seguro que la diversidad de antece- 
dentes dtnicos, clases sociales, localizaciones 
geogrificas y entomos urbanos contra rurales 
tendrfan una reprcsentacidn proporcional en la 
muestra. 

En el mundo real, obtener muestras nor- 
mativas nunca es tan sencillo y definitivo como 
el caso hipotdtico anterior. Los investigadores 
no tienen una lista completa de todos los nifios 
de sexto grado en el pais y, aunque la tuvieran, 
quienes desarrollan pruebas no podrfan obligar 
a todos los nifios scleccionados al azar a que 
participaran en la cstandarizaci6n de una prue¬ 
ba. Tambidn surgen asuntos relacionados con 
el costo. Debe pagarse a los psiedmetras para 
que apliquen la prueba al grupo normativo. Los 
autores de la prueba pueden optar por unos 
cuantos cientos de personas representativas en 
vez de ulilizar un niimero mayor. 

Para ayudar a asegurar que los grupos nor¬ 
mativos de menor tamafio scan vcrdadcramen- 
tc representatives de la poblacidn para la cual 
se disefid la prueba, los autores de la misma 
utilizan un muestreo aleatorio estratificado. 
Este enfoque consiste en estratificar, o clasifi- 
car, a la poblacidn bianco en cuanto a variables 
antecedentes (como edad, sexo, raza, clase so¬ 
cial, nivel educativo) y despuds seleccionar al 
azar un porcentaje apropiado de personas den¬ 
tro de cada estralo. Por ejcmplo, si 12% de la 
poblacidn relacionada es afroestadounidense, 
entonces quien desarrolla la prueba elige los 
sujetos de manera aleatoria, pero con la restric- 
cidn de que 12% del grupo normativo debe ser 
tambidn afroestadounidense. 

Ep la pr£ctica, muy pocos creadores de 
pruebas reproducen completamente el mues¬ 
treo aleatorio o el muestreo aleatorio estrali- 
ficado en el proceso de seleccidn del grupo 
normativo. Lo que es mds tfpico es un esfuerzo 
de buena fc por elegir una muestra diversa y 
representativa de escuelas fuertes y ddbiles; ve- 
cindarios minoritarios y blancos; ciudades gran- 
des y pequefias y comunidades del noite, este, 
centro y sur. Si esta muestra engloba entonces 
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aproximadamcntc el mismo porcentaje dc mi- 
norfas, habitantes de las ciudades, familias de 
clase alta y baja que el censo nacional, enton- 
ces los autores de la prueba se sienten seguros 
de que el gnipo es representative). 

Existc una importante leccidn en las incer- 
tidumbres, concesiones y aspectos prtkucos de 
la seleccidn del grupo normativo; a saber, que 
las normas de pruebas psicoldgicas no son ab- 
solutas, universales o intcmporalcs. Son relati- 
vas a una dpoca histdrica y a la poblacidn 
normati va particular de la cual se deri varon. Se 
ilustrard la naturaleza effmera de las estadfsti- 
cas normativas en una seccidn posterior cuan- 
do se muestre edmo una importante prueba de 
Cl en cuyas normas se establecid un promedio 
nacional de 100 puntos en 1974, produjo un 
promedio nacional de 107 en 1988. Incluso las 
normas que se seleccionan con gran cuidado y 
se basan en muestras grandes pueden volverse 
obsoletas en el curso de un decenio —y en oca- 
sioncs menus. 

NORMAS POR ED AO Y GRADO ESCOLAR 

A medida que uno crecc, se cambia de manera 
calculable, ya sea para mejorar o empeorar. Esto 
es obviamente cierto en la infancia, cuando las 
habilidades intelectuales mejoran visiblemente 
de un mes a otro. En la edad adulta, el cambio 
personal es lento, pero aun se puede discemir. 
Por ejemplo, se espera que los adultos muestren 
un nivel rods maduro de vocabulario con cada 
decenio que transcurre (Gregory y Gemert, 1990). 

Una norma por edad representa el nivel 
de desempefio en la prueba para cada grupo 
independiente segun la edad dentro de la mucs- 
tra normativa. El propdsito de las normas por 
edad es el de facilitar las comparaciones entre 
individuos de la misma edad. Con las normas 
por edad, el desempefio de una persona se in- 
terpreta en relacidn con los sujetos dentro de la 
estandarizacidn que tienen la misma edad. El 
rango de edades para un grupo normativo por 
edad puede variar de un mes a un decenio o 
mils, segun el grado en que el desempefio en la 
prueba depende de los anos de vida. Para ca- 


ractensticas que cambian con rapidez —como 
las capacidades intelectuales durante la infan¬ 
cia— los creadores de pruebas podrfan infor- 
mar normas independientes de prueba para 
grupos dc edad definidos de manera cstrecha; 
por ejemplo, intervalos de cuatro meses. Esto 
permite que, por decir, el examinador compare 
los resultados dc prueba de un nifio que tie- 
ne cinco aiios, dos meses de edad (edad 5-2) 
con la muestra normativa dc nifios que van 
de los 5-0 a los 5-4 aiios. En contraste, las 
caracterfsticas adultas cambian de manera m6s 
lenta y podrfa scr suficiente con informar da- 
tos normativos para intervalos de edad dc 5 o 
10 aiios. 

Las normas segtin el grado escolar son 
conceptualmente similares a las normas por 
edad. Una norma por grado representa el ni¬ 
vel de desempefio en pruebas para cada grado 
escolar dentro de la muestra normativa. Las 
normas por grado se utilizan poco en el caso de 
pruebas de capacidad. Sin embargo, <Sstas son 
especialmente dtiles en entornos educativos, 
cuando se presentan los nivelcs dc rendimiento 
de los niiios en edad escolar. Dado que el ren¬ 
dimiento acaddmico en muchas dreas de conte- 
nido depende en gran medida de la cxposicidn 
al currfculo de materias segun el grado escolar, 
la comparacidn de un estudiante contra una 
muestra normativa del mismo grado es mis 
apropiada que emplear comparaciones basadas 
en la edad. 


NORMAS LOCALES Y DE SUBGRUPO 

En el caso de muchas aplicaciones, las normas 
locales o de subgrupo son necesarias para ajus- 
tarse al propdsito especffico de una prueba. Las 
normas locales se obtienen de individuos re¬ 
presentatives a nivel local, por el contrario de 
una muestra nacional. De la misma manera, las 
normas de subgrupo consisten dc las puntua- 
ciones obtenidas por un subgrupo representati¬ 
ve (afioestadounidenses, individuos de origen 
latinoamericano, mujeres), por el contrario de 
una muestra diversificada a nivel nacional. 
Como ejemplo del uso de las normas locales. 
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e | encaigado de admisiones de una escuela 
semisuperior quc atrae principalmente a residen¬ 
ts locales podrfa preferir la consulta de normas 
estatales en una prueba de aprovechamiento 
escolar, en vez de las normas nacionales. 

Como regia general, cuando un subgrupo 
identificable tiene un desempefio en prueba que 
es superior o inferior de mancra apreciable al 
de la muestra de estandarizacidn definida de 
modo mds amplio, puede ser util construir nor¬ 
mas complemcntarias para ese subgrupo. Los 
subgrupos puedcn formarse con respecto al 
sexo, antecedentes dtnicos, regidn geogrdfica, 
ambientc urbano contra rural, nivcl socioecond- 
mico y muchos otros factores. 

El que las normas locales o de subgrupo 
scan bendficas depende del propdsito de la prue¬ 
ba. Por ejemplo, las normas dtnicas para pruebas 
estandarizadas de inteligencia puedcn ser su- 
pcriores a las normas con base nacional en cuan- 
to a pronosticar la competencia dentro del 
ambience no escolar del nifio. Sin embargo, 
puede ser que las normas dtnicas no pronosti- 
quen el dxito que tendrd el nirio en los programas 
educativos de las cscuelas publicas convencio- 
nales (Mercer y Lewis, 1978). Por tanto, las 
normas locales y de subgrupo dcben utilizarse 
de manera cautelosa. 


CUADROS DE EXPECTATIVAS 

Una forma prdctica que pueden asumir las 
normas es un cuadro de expectativas, que re- 
presenta las rclaciones establecidas entre las 
puntuaciones dc prueba y el resultado csperado 
en una tarea relacionada (Harmon, 1989). Los 
cuadros de expectativas son especialmente utiles 
con pruebas predict!vas utilizadas para pronosti¬ 
car criterios bien definidos; por ejemplo, podrfa 
dcscribir la relacidn entre las puntuaciones de 
una prueba dc aptitud escolar (medio de pre- 
diccidn) y el subsecucnte promedio de califi- 
caciones en la univcrsidad (criterio). 

Los cuadros de expectativas se basan siem- 
prc en los resultados previos del medio de pre- 
diccidn y del criterio en muestras amplias de 
personas examinadas. El valor priictico de ta¬ 


bular de esta manera la informacidn normativa 
es que los nuevos individuos que sc examinen 
rccibirdn un avance de sus probabilidadcs de 
dxito en cuanto al criterio. Por ejemplo. a los 
estudiantes de educacidn media superior que 
realizan una prueba de aptitud escolar, se les 
pueden presentar las probabilidades estadfsli- 
cas de lograr un promedio especffico de califi- 
caciones en la universidad. 

Con base en 7 835 individuos cxaminados 
previamente que de manera subsccuente asis- 
tieron a una universidad importance, el cuadro 
de expectativas del cuadro 3-6 proporciona la 
probabilidad de lograr ciertas calificaciones en 
el primer afto de universidad, en funcidn de las 
puntuaciones en el examen del American 
College Testing (ACT). La prueba ACT se apli- 
ca por lo cornun a estudiantes del ultimo afio 
de preparatoria que han expresado un interns 
por asistir a la universidad. La primera colum- 
na del cuadro muestra las puntuaciones en la 
prueba ACT, divididas en 10 intcrvalos de cla- 
se. La segunda columna proporciona el ntime- 
ro de estudiantes cuyas puntuaciones caen 
dentro de cada intervalo. Las ecuaciones res- 
tantes en cada fila muestran el porcentaje de 
estudiantes dentro de cada intervalo de puntua¬ 
ciones de prueba que de manera subsecuente 
recibieron calificaciones universitarias dentro 
de un rango designado. De los 117 estudiantes 
que obtuvicron de 31 a 33 puntos en la ACT, 
s61o 2% recibid en su primer aiio de universi¬ 
dad un promedio dc calificaciones por debajo 
de 1.50, mientras que 64% obtuvo calificacio¬ 
nes superlativas de 3.50 a una “A” perfecta o 
4.00.* En el otro extremo, de los 102 estudian¬ 
tes que tuvieron puntuaciones inferiores a 10 
puntos en la ACT, 80% completo (60% mds 
20%), recibid calificaciones universitarias du¬ 
rante el primer ado que se encontraban por de¬ 
bajo de un promedio dc 2.00 o “C”. 


•Nota del traductor: Las calificaciones universitarias 
en EUA abarcan s6lo cuatro puntos. Es deeir, la pun- 
tuacidn dc 1.5 equivaldrfa a una calificaci6n muy baja; 
un 3.S a una alia y 4.00 es la puntuacidn mis alia 
posiblc. Estas calificaciones sc represenlan iambi<5n 
con letras, con las equivalencies aproximadas que 
mcnciona cl autor. 
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Cuadro 3-6. Cuadro de expectativas que muestra la relacibn entre la puntuacidn 
mixta de la prueba ACT y las calificaciones del primer ano de universidad 
para 7 835 alumnos de una universidad estatal importante 


Puntuaciones en la 
prueba ACT 

Numero de 

casos 


Promedio de Calificaciones (Escala 4.00) 

0.00- 

1.49 

1.50- 

1.99 

2.00- 

2.49 

2.50- 

2.99 

3.00- 

3.49 

3.50- 

4.00 

34-36 

3 

0 

0 

33 

0 

0 

67 

31-33 

117 

2 

2 

4 

9 

19 

64 

28-30 

646 

10 

6 

10 

17 

23 

35 

25-27 

1 458 

12 

10 

16 

19 

24 

19 

22-24 

1 676 

17 

10 

22 

20 

20 

11 

19-21 

1 638 

23 

14 

25 

18 

16 

4 

16-18 

1 173 

31 

17 

24 

15 

11 

3 

13-15 

690 

38 

18 

25 

12 

6 

1 

10-12 

332 

54 

16 

20 

6 

3 

1 

Interior a 10 

102 

60 

20 

13 

8 

0 

0 


Nola: algunas Mas totaiuan mis da 100% debfdo a errofcs de redoodeo. 

Fuanlo: Cortesla de Archie George, Management Information Services, Universidad de Idaho 


Por supuesto, los cuadros de expectativa 
no predeterminan el dxito o fracaso de las per¬ 
sonas cxaminadas con respecto al criterio. En 
un caso individual, es posible que un estudian- 
te con una baja calificacibn en la ACT pueda 
veneer el prondstico y obtener un promedio de 
calificaciones de 4.00 en la universidad. Sin 
embargo, es m£s cornuri que los nuevos indivi- 
duos examinados descubran que los cuadros de 
expectativa proporcionan un anticipo bastante 
preciso del desempeno en el criterio. 

Peroexisten algunos casos individuales en 
los que los cuadros de expectativas pueden vol- 
verse imprecisos. Un cuadro de expectativas se 
basa siempre en el dcsempefio previo de una 
muestra grande y representativa de personas 
evaluadas, cuya ejecucidn en prueba y resulta- 
dos en el criterio reflejaron condiciones socia- 
les y polfticas institucionales existentes. Si hay 
un cambio en polfticas o condiciones, un cua¬ 
dro de expectativas puede volverse obsoleto y 
engafioso. Considdrese el cuadro dc expectati¬ 
vas en la figura 3-9, que presenta la probabili- 
dad de terminar la secundaria en funcidn del 


Cl en el sdptimo grado escolar (Dillon, 1949, 
citado en Matarazzo, 1972, p. 283). Obsdrvese 
que en el decenio de 1940, s61o 4% dc los estu- 
diantes dc sdptimo grado con un Cl por debajo 
de 85 terminaron la secundaria. Sin embargo, 
las polfticas sociales y ambientes escolares han 
cambiado desde ese entonces. En la actualidad 
se da un fuerte dnfasis a los servicios sociales 
dirigidos a los estudiantes discapacitados, con 
la meta de retenerlos y que lleguen a graduar- 
se. Como resultado, el cuadro de expectativas 
de la figura 3-9 seguramente serfa errOneo y 
pesimista si sc aplicara a los estudiantes actua¬ 
tes de sdptimo grado que tienen un Cl bajo. 

§1 PRUEBAS REFERIDAS A CRITERIO 


Esta unidad termina con una breve mencidn de 
una altemativa a las pruebas referidas a la nor¬ 
ma; es decir, las pruebas referidas a criterio 
(Frcchtling, 1989; Glaser, 1963; Popham, 1978; 
Berk, 1984). Mientras que las primeras utilizan 
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Cl en el NOmoro 

Optimo do Porcentaje quo tormina la socundarla 

grado alumnos o 10 20 30 40 50 60 70 80 90 100 
<85 400 | 


85-94 

95-104 

105-114 

115* 



Flgura 3-9. Expectativa de graduation de la secunda¬ 
ria an lunciOn del Cl en el sOptimo grado escolar. 
Fuente: Basado en dalos de Dillon. H. J. (1949). Early 
school leavers: A major educational problem. Nueva 
York: National Child Labor Committee. Cilado en 
Matarazzo (1972). 

una muestra representativa de personas como 
su marco de referenda intcrprctativo, un.i prue- 
ba referida a criterio compara los logros de un 
individuo cxaminado con un area bien deftnida 
de contenido. Por cjemplo, el desempeno de la 
persona que se somcte a prueba podrfa presen- 
larse como un nivel especffico de habilidad en 
aritmdtica (suma correctamcntc 2 numcros de 
3 dfgitos en 100% de las ocasiones, pero s6lo 
tiene 70% de precisidn cuando suma 3 nume- 
ros de 3 dfgitos). 


Las pruebas referidas a criterio representan 
un cambio fundamental en perspectiva. El cen¬ 
tra de atencidn se coloca en aqucllo quc el exa¬ 
minado puedc haccr, mds que en comparaciones 
con los niveles de desempeno de otros indivi- 
duos. Asf, las pruebas referidas a criterio idcn- 
tifican el dominio (o falta de dominio) absoluto 
de la persona examinada en relacidn con con- 
ductas especfficas. En general, estas pruebas se 
han utilizado cn entomos escolares para ayu- 
dar a los maestros dentro del saldn de clase a 
determinar qud se debe ensenar y tambidn para 
evaluar los efectos precisos de los esfuerzos de 
ensenanza del currfculo escolar. 

Las pruebas referidas a criterio son mds 
adecuadas para examinar las habilidades aca- 
ddmicas bdsicas (p. ej., mvel de lectura, habili¬ 
dades de cdlculo aritmdtico) en ambientes 
educativos. Sin embargo, estos tipos de ins- 
trumentos son sumamente inapropiados para 
examinar capacidades de nivel superior, debi- 
do a que cs diffcil formular objetivos espeeffi- 
cos para dichas dreas de contenido. Considd rese 
un caso cn particular: £cdmo se desarrollarfa 
una prueba referida a criterio para examinar la 
pericia en programacidn de computadoras? 
Serfa diffcil proponer conductas especfficas que 
pudieran posccr todos los expertos en progra- 
macidn de computadoras y, por tanto, serfa casi 
imposible construir una prueba referida a crite¬ 
rio para esta habilidad de alto nivel. Berk (1984) 
analiza los problemas tdcnicos en la construc- 
cidn y evaluacidn de este tipo de pruebas. 


Hresumen 


1. Un grupo normativo consiste de una mues¬ 
tra de individuos examinados que son re¬ 
presentatives de la poblacidn hacia la cual 
se dirige la prueba. Una distribucidn de fre- 
cuencias es util para representar la distri- 
bucidn de las puntuaciones de prueba dentro 
de ciertos intcrvalos de puntuacidn para un 
grupo normativo. Un histograma es la re- 
prcsentacidn grdfica de una distribuci6n de 
frecuencia. 


2. Las medidas de tendencia central para con- 
juntos de puntuaciones incluyen la media o 
promedio aritmdtico, la mediana o califica- 
cion a la mitad de las puntuaciones clasifi- 
cadas, y la moda, que es la puntuacidn que 
ocurre con mayor frecuencia. 

3. Las medidas de variabilidad para un grupo 
de puntuaciones incluyen la varianza y su rafz 
cuadrada, la desviacidn estandar, que cs la 
medida preferida cn las pruebas psicoldgicas. 
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Estos indices ayudan a estimar la disper¬ 
sion dc las punluacioncs a travOs de incor- 
porar cn sus formulas las sumas de las 
desviaciones con respecto a la puntuaciOn 
media, elevadas al cuadrado. 

4. La distribucidn de puntuaciones de prueba 
de grandes grupos de individuos heterogO- 
neos se asemeja con ffecuencia a la distribu- 
ciOn normal; una curva simdtrica, definida 
en tdrminos matemdticos y que adopta for¬ 
ma de campana. Los psicOlogos prefieren 
tratar con puntuaciones de prueba que se 
distribuyen normalmcntc, debido a que las 
caractcrfsticas estadfsticas de la distribucidn 
normal son muy conocidas. 

5. Una distribucidn asimdtrica es aqudlla en 
la que las puntuaciones se agrupan en el ex- 
tremo inferior (asimetrfa positiva) o en el 
extremo superior (asimetrfa negativa). En 
las pruebas psicoldgicas, la causa mds co¬ 
mun de asimetrfa positiva es la prcsencia 
de muy pocos reactivos fdciles, mientras la 
causa mds comun de asimetrfa negativa es 
que la prueba tiene muy pocos reactivos 
diffeiles. 

6. Un percentil expresa el porcentaje de per¬ 
sonas dentro de la muestra de estandariza- 
cidn que tuvieron puntuaciones por debajo 
de cierta puntuaciOn natural. Los percentiles 
varfan de 0 a 100. Es importance distinguir 
entre el percentil (una medida relativa) y el 
porcentaje de respuestas correctas (una 
medida absoluta). 

7. Una puntuaciOn estdndar expresa la pun¬ 
tuaciOn natural de la persona examinada cn 
tdrminos de su distancia con respecto a la 
media en unidadcs dc dcsviaciOn estdndar. 
La formula para una puntuaciOn estdndar es 
z = (X - X)IDE. La puntuaciOn T es una 
puntuaciOn estdndar con media de SO y des- 
viaciOn estdndar de 10. La fOrmula para una 
puntuaciOn T es: 

r=io(x-xyoe+50 


8. El enfoque mds comun para seleccionar un 
grupo normativo es a traves del muestreo 
aleatorio estratificado. En este procedi- 
miento, se estratifica o clasifica la poblaciOn 
bianco en cuanto a importantes variables 
antecedentes (p. ej., edad, sexo, raza, clase 
social, nivel educativo) y despuds se elige 
al azar un porcentaje apropiado de perso¬ 
nas dentro de cada cstrato. 

9. En el caso de muchas pruebas, es impor¬ 
tance proporcionar normas independientes 
por edad y grado cscolar. Las normas por 
edad son necesarias para caractcrfsticas 
que cambian rdpidamente con el desarrollo 
—como las capacidades intelectuales en la 
infancia. Las normas por grado sc utilizan 
comunmente en entomos escolarcs cuando 
se informa sobre los niveles de rendimien- 
to de nifios en edad escolar. 

10. Las normas locales y dc subgrupo pueden 
ser valiosas si un subgrupo identificable tic- 
ne un desempefio en una prueba que, de ma- 
ncra evidente, es mejor o peor que el de la 
muestra de estandarizaciOn definida en tdr¬ 
minos mds amplios. 

11. Un cuadro de expectativas —una forma de 
estandarizaciOn de prueba— representa la 
relaciOn establecida entre las puntuaciones 
dc prueba y cl resultado esperado en una 
tarea relacionada. Por ejcmplo, un cuadro 
de expectativas podrfa mostrar la relaciOn 
entre las puntuaciones de una prueba de 
aptitud escolar y el subsecuente promedio 
de calificaciones cn la universidad. 

12. Una prueba referida a criterio compara los 
logros del individuo en la prueba con un 
drea bicn definida de contenido. Estas prue¬ 
bas ayudan a idcntificar el dominio o falta 
de dominio de la persona examinada en 
cuanto a conductas especfficas. Por ejem- 
plo, los resultados de una prueba referida a 
criterio podrfan especificar que la persona 
suma correctamente 2 numeros de 3 dfgitos 
en 100% dc las ocasiones. 
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K T^RMINOS Y CONCEPTOS CLAVE 


Grupo normativo p. 70 

Puntuacidn natural p. 70 

Distribucidn de frecuencias p. 72 

Histograma p. 73 

Polfgono dc frecuencias p. 73 

Media p. 73 

Mcdiana p. 73 

Moda p. 73 

Desviacidn csttindar p. 74 

Varianza p. 74 

Disu-ibuci6n normal p. 74-75 

Asimetrfa p. 76-77 

Percentil p. 77-78 

Puntuaciones estandarizadas p. 80 


Puntuacidn T 

p. 81 

Puntuaciones estandararizadas 


normal izadas 

p. 82 

Escala de estaninas 

p. 83 

Escala estenes 

p. 84 

Escala C 

p. 84 

Muestreo aleatorio 

p. 85 

Muestrco aleatorio 


estratificado 

p. 85-86 

Norma por edad 

p. 86 

Norma por grado 

p. 86 

Normas locales 

p. 86 

Normas de subgrupo 

p. 86-87 

Cuadro de expectativas 

p. 87 


















































































































Tema 3B 

Conceptos de confiabilidad 


Ejempto de caso 3-2. Confiabilidad de prueba y testimonlo en un tribunal 
Teoria clbsica y fuentes de error de medicibn 
Fuenles de error de medicibn 
Error de medicibn y confiabilidad 
Coeliciente de confiabilidad 
Coeficiente de correiacibn 

Coeliciente de correiacibn como coeficiente de confiabilidad 
Confiabilidad como estabilidad temporal 
Confiabilidad como consistency interna 
Modelo de muestreo del dominio y la teoria de la capacidad para la generalizacibn 
Circunstancias especiales en la estlmacibn de la confiabilidad 
Inlerpretadbn de los coeficientes de confiabilidad 
Confiabilidad y error estbndar de medida 
Resumen 

Tbrminos y conceptos clave 

111! I Pill■ INI lllim IMMI1 ■■Him 


k 



Lki confiabilidad sc refiere a] atnbutodc 
consistcncia en medicibn. Sin embargo, es poco 
frccuente que la confiabilidad sea un asunto de 
todo o nada; lo mbs comun es que sea una cues- 
tibn de grado. Muy pocas medidas de las carac- 
terfsticas ffsicas o psicolbgicas son toialmente 
consistentes, incluso de un momento al siguien- 
te. Por ejemplo, una persona que se pesa en una 
bbscula dos veces, en rapida sucesibn, podrfa 
registrar un peso de 66 kg la primera vez y 66 kg, 
100 g, la segunda. El mismo individuo podrfa 
responder dos formas supuestamente cquiva- 
lentes de una prueba de Cl y obtener 114 puntos 
en la primera y 119 en la segunda. Dos medi¬ 


das sucesivas de vclocidad de respuesta —opri- 
mir con rapidez una tecla cada vez que aparecc 
la Ictra X en una pantalla de microcompu- 
tadora— podrfan producir un tiempo de re- 
accibn de 223 milisegundos en el primer ensa- 
yo y de 341 milisegundos en el siguiente. En 
estos ejemplos se observa un patrbn de consis¬ 
tence —los pares de mediciones no son total- 
mente aleatorios— pero tambien es evidente que 
existen cantidadcs diferentes de inconsistencia. 
En el corto plazo, las medidas de peso son muy 
consistentes, las puntuaciones de pmebas inte- 
lectuales son moderadamente estables, pero cl 
liempo de reaccibn simple es un tanto errbtico. 
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Es mejor considerar al concepto dc confia- 
bilidad como un continuo que abarca dcsde la 
consistencia minima de una medicidn (p. ej., 
ticmpo de reaccidn simple) a la casi perfecta 
repetibilidad de los resultados (p. ej.. peso). La 
mayor parte de las pruebas psicoldgicas sc 
encuenlran en algun sitio cntre estos dos extre- 
mos. Con respecto a las pruebas, un grado acep- 
table de confiabilidad es mis que una cucstidn 
acadcmica. Despuds de todo, serfa absurdo y 
poco dtico basar las decisioncs importantes en 
resultados dc prucba que no pueden repetirse 
(ejemplo de caso 3-2). 

Los psicdmetras han disenado varios md- 
todos estadfsticos para estimar el grado dc 
confiabilidad de las mediciones y se explora- 
rl con cicrto detalle el cllculo de dichos coefi- 
cicntes dc confiabilidad. Pero, en primer tdr- 
mino, se analiza un problema mis fundamental 
con el propdsito dc ayudar a aclarar el signifi- 
cado de la confiabilidad: ^culles son las fuen- 
tes de consistencia e inconsistencia en los 
resultados de una prueba psicoldgica? 

I TEORIA CLASICA Y FUENTES 
DE ERROR DE MEDICI6N 


La tcorfa de la medicidn presentada aquf sc ha 
llamado teorfa cllsica, debido a que se le elabo- 
r6 a partir de suposiciones simples realizadas 
por los tedricos de las pruebas desde el origen 
de estos instrumentos. Este cnfoque tambidn sc 
dcnomina teoria dc puntuaciones verdaderas 
y falsas. por razones que se explican mis ade- 
lante. Charles Spearman (1904) establecid las 
bases para la teorfa, que despuds aumcntaron y 
revisaron algunos psicdlogos contemporlneos 
(Feldt y Brennan, 1989; Gulliksen, 1950; Lord 
y Novick, 1968; Kline, 1986). Se debc mencio- 
nar que no existe un modclo rival. La teorfa del 
muestreo del dominio surgid con la reformula- 
cidn de Tryon (1957), que Cronbach, Gleser, 
Nanda y Rajaratnam (1972) han extendido re- 
cientemente para formar una teorfa altemativa 
denominada teorfa de la capacidad para la ge- 
neralizacidn. Mis adelante, se harl una breve 


referencia a la perspectiva del muestreo del 
dominio. Sin embaigo, la teorfa cllsica aun es 
el punto de vista prevalcciente en psicomctria. 
En vista dc ello, nos concentraremos en este 
modclo. 

El punto blsico inicial dc la tcorfa cllsica 
de medicidn es la idea de que las puntuacio¬ 
nes dc prucba son el resultado de la influencia 
dc dos factores: 

1. Factores que contribuycn a la consistencia. 
£stos comprcnden en su total idad los atribu- 
tos estables del individuo que el examinador 
intenta medir. 

2. Factores que contribuycn a la inconsistencia. 
£slos incluyen caracterfsticas del individuo, 
la prueba o la situacidn que no tienen nada 
que vercon el atributo a medir, pero que, sin 
embargo, afectan las puntuaciones de 
prucba. 

Deberfa quedar claro que el primer factor es 
deseable porque representa la verdadera can- 
tidad del atributo en cuestidn, mientras el se- 
gundo factor representa la molcstia inevitable 
de los elementos de error que contribuyen a 
imprecisioncs en la mcdici6n. Se puedc expre- 
sar csta diferenciacion conceptual en una ccua- 
ci6n simple: 

X a V* e 

donde X es la puntuacidn obtenida, V es la pun- 
tuaciln vcrdad6ra y e representa los errores 
de medicidn. 

Asf, estos ultimos representan discrcpan- 
cias cntre las puntuaciones obtenidas y las pun¬ 
tuaciones verdaderas correspondientes: 

e — X — V 

Obsdrvese que en las ccuaciones anteriores cl 
error de medicidn e puede ser positivo o nega- 
tivo. Si e es positivo, la puntuacidn X obtenida 
serl mis alta que la puntuacidn verdadera V. 
Por cl contrario, si e es negativo, la puntuacidn 
obtenida serl menor que la puntuacidn verda¬ 
dera. Aunque es imposible eliminar todos los 
errores dc medicidn, quienes desarrollan 
pruebas se esfuerzan por reducir al mfnimo esta 
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EjEMPLO DE CASO 3-2 

CONF1ABIUDAD DE PRUEBA Y TEST1MONIO EN UN TRIBUNAL 

La confiabllidad de los datos de prueba puede tenor un impacto decisivo sobre el curso legal 
de las dlllgencias. Considbrense los problemas que surgieron en un Juiclo de violacibn 
en donde la supuesta victims era una mujer de 22 afios con discapacidad menial. En la 
mayorla de los juicios de violacibn se acusa al Inculpado de utilizar la fuerza o amenazas en 
la comisibn de un acto sexual. Este caso era poco comun porque el inculpado estaba bajo una 
acusacidn de estupro, aun cuando la vlclima era mayor de edad. El abogado de la parte acu- 
sadora sostenla que, debido a su discapacidad mental, aunque la vlctima habfa accedido, era 
Incapaz de dar un consentimlento signilicativo al acto sexual. 

Todos aquellos que conocfan a la mujer sablan que era "lenta"; de hecho, dos profeslonales 
de salud mental atirmaron que tenia un retraso mental leve. Con base en parte en el WAIS-R, un 
psicblogo consultor llegb tambibn a un dlagnbstlco olicial de retraso mental. La mujer obtuvo 
un Cl Verbal de 68 puntos, un Cl de EJecuckSn de 75 puntos y un Cl Total de 71 puntos. Un Cl 
menor a 70 (o 75 en casos excepcionales) es sblo uno de vartos crflerios del retraso mental, 
como se analizarb en el tema 7A, Pruebas con pobladones espedales. Asl, las punluadones se 
encontraban justo apenas dentro del rango de retraso mental leve y se votvleron el punto local 
de las negodaciones previas entre la parte acusadora y el abogado de la defensa, quien deseaba 
roalizar sus propios arreglos para una prueba Independienle. Sin duda, el abogado de la defensa 
esperaba que una segunda ronda de pruebas producirla puntuaciones mbs alias de Cl y, por 
tanto, refutarla la evidencia danina de que la joven tenia retraso mental. 

^Qu6 podia decirle el psicblogo consultor al abogado de la acusacibn acerca del probable 
resultado de una segunda aplicacibn del WAIS-R? Es bien conocido que, en general, los resultados 
de una prueba de Cl son consistentes en el corto plazo, pero £qud tan consistentes? ^Era 
probable que la joven obtuviera puntuaciones dentro del rango de retraso mental en la segunda 
aplicacibn? La respuesta a esta ultima pregunla estaba llena de signiflcado legal. Si los resultados 
de la segunda prueba confirmaban los datos originales, entonces la estrategia de julcio de la 
acusacibn estaba asegurada. Sin embargo, si la supuesta vlctima obtenla puntuaciones 
sustancialmente mayores en la segunda ocasibn, dichos datos arrojarian dudas acerca del 
diagnbstico de retraso mental. Como resultado, el fiscal se veria obligado a revisar de manera 
sustancial sus tbclicas para el juiclo —casi literalmente de un dla para otro. La teorfa psicombtrica 
habla dejado las alturas do la abstraccibn acadbmica y habla tocado tierra en el tribunal: las 
maniobras previas en un caso de violacibn dependlan, en parte, de la posible repetibilidad o 
confiabllidad de los resultados de una prueba psicolbgica. 

El psicblogo consultor le informb al fiscal que las probabilidades eran de 2 a 1 en favor de 
quo el segundo Cl Total cayera entre 68 y 74 puntos, suponiendo que hubiera pasado el tiempo 
suficiente como para eliminar cualesqulera efectos de prbctica de la primera aplicacibn. La 
prediccibn resultb corrects. Un segundo psicblogo, contratado por la defensa, enconlrb que 
la joven tenia un Cl Total de 72 puntos, sblo un punto por arriba de los datos originales. £Cbmo 
fue posible pronoslicar de antemano este resultado? Esta pregunta es central para el concepto 
de confiabllidad que se presents en este tema. De manera Incidental, al acusado se le encontrb 
culpable de violacibn y se le sentencib a 15 afios do prisibn. Este resultado se basb, en parte, en 
la consistency o confiabllidad del resultado de una prueba psicolbgica. 
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incomodidad psicomdtrica al prestar una atcn- 
ci6n cuidadosa a las fuentes de error de medici6n 
quc sc cxplican en la siguicnte seccidn. 

Por ultimo, es importante destacar que la 
puntuacidn verdadera nunca se conoce. Como 
descubrird cl lector, se puede obtcner una pro- 
babilidad de que la puntuacidn verdadera resi- 
da dentro de cierto intcrvalo y, tambidn, se 
puede extraer un mejor cstimado de la puntua¬ 
cidn verdadera. Sin embargo, nunca sc puede 
conoccr con certidumbrc el valor de una pun¬ 
tuacidn verdadera. 

R FUENTES DE ERROR DE 
!‘Medici6n 


Como lo indica la fdrmula X - V + e, el error de 
medicidn e es todo aqucllo diferente a la puntua- 
cidn verdadera, quc forma parte de la pun- 
tuacidn obtenida en la prueba. Los errorcs de 
medicidn pueden surgir de innumcrables fuen¬ 
tes (Feldl y Brennan, 1989). Stanley (1971) pro- 
porciona una lista inusualmente amplia. Aquf 
se describirdn sdlo las contribuciones mds im- 
portantes y probables: la seleccidn de reactivos, 
la aplicacidn de la prueba, la calificacidn de la 
misma y los errores sistcmdticos de medicidn. 

SELECCI6N de reactivos 

Una fuente de error de medicidn es cl instru- 
mento en sf mismo. El autor de una prueba debe 
decidirse por un numero finito de reactivos de 
una reserva potentialmentc infinita de preguntas 
de prueba. ^Cudles preguntas deben incluirse? 
^Cdmo deben frasearsc? La seleccidn de reac¬ 
tivos es crucial para la precisidn de la medida. 

Aunquc los psiedmetras se esfuerzan por 
obtener reactivos representatives de prueba, el 
conjunto particular de preguntas elegidas para 
una prueba podrfa no ser equitativo por igual 
para todos los individuos. Un ejemplo hipotdti- 
co, deiiberadamente extremo, servira para ilus- 
trar este punto: aun un estudiante bien preparado 
podrfa reprobar una prueba acaddmica que 


enfatizara las oscuras notas de pie de pdgina 
dentro del libro de texto. En contrastc, un estu- 
diantc mal preparado, pero curioso, que hubicra 
cstudiado sdlo las notas de pie de pdgina, po¬ 
drfa tener un buen resultado en un examcn de 
este tipo. Las calificacioncs de ambas personas 
reflejarfan cantidadcs masivas de error de me¬ 
dicidn. Rccudrdese que en este contexto la pun¬ 
tuacidn verdadera es aquello que el estudiante 
realmente sabe. Para cl estudiante escrupulo- 
so, la calificacidn obtenida serfa bastantc infe¬ 
rior a su calificacidn verdadera, debido a una 
enorme dosis de error de medicidn. Para el se- 
gundo estudiante, que sabe las respucstas por 
casualidad, la puntuacidn obtenida serfa bas- 
tante mas alta quc su puntuacidn verdadera, 
debido a un error positivo de medicidn. 

Por supuesto, en una prueba bien dise- 
nada, el error de medicidn provenientc de la 
muestra de reactivos serd mfnimo. Sin embar¬ 
go, una prueba siempre constituye una muestra 
y nunca la totalidad del conocimicnto o con- 
ducta de una persona. Como resultado, la se- 
leccidn de reactivos siempre es una fuente de 
error de medicidn en las pruebas psicoldgicas. 
Lo mds que puede hacer un psiedmetra es re- 
duciral mfnimo esta molestia indeseable al aten- 
der con cuidado los problcmas relacionados con 
la construccidn de pruebas. Se analizardn los 
aspcctos tdcnicos de la seleccidn de reactivos 
en el tema 4B, Construccidn de pruebas. 

APLICAClbN DE LA PRUEBA 

Aunque en general los examinadores propor- 
cionan un ambiente dptimo y estandarizado de 
prueba, las circunstancias de aplicacidn pue¬ 
den dar lugar a numerosas fuentes de error de 
medicidn. Ejemplos de las condiciones ambienta- 
les generales que pueden ejereer una influencia 
desfavorable sobre la precisidn de la medicidn, 
incluyen una temperatura inedmoda en la habi- 
tacidn, iluminacion deficiente y ruido cxcesi- 
vo. En algunos casos, no es posiblc anticipar 
las cualidades de la situacidn de prueba que 
contribuirdn al error de medicidn. Considdrcse 
el siguiente ejemplo: un estudiante de pregrado, 
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que en otros scnlidos cs mediocre, respondc 
correclamentc un reactivo no muy diffcil de in- 
formacidn en el que se pregunta: "^quidn es- 
cribid Los cuentos de CanterburyT Cuando se 
|e interroga despuds sobre si ha lefdo alguna 
obra dc Chaucer, el cstudiantc respondc: “No, 
pero el libro estA justo detrAs de us(ed en el li- 
brcro”. 

Las fluctuaciones momcntdneas en ansie- 
dad, motivacidn, atencidn y nivel de fatiga en 
la persona examinada tambidn pueden introdu¬ 
ce fuentes de error de medicidn. Por ejemplo, 
una persona que no ha dormido bien la noche 
anterior a la prueba, podrfa carccer de concen- 
tracidn y, por tanto, leer mal las preguntas. Un 
cstudiantc distrafdo por una angustia cmocio- 
nal temporal podrfa responder inadvertidamente 
en las columnas incorrectas de la hoja de res- 
puestas. La pesadilla clAsica en estc sentido cs 
cl individuo que se brinca una pregunta —di- 
gamos la numero 19— pero olvida dejar en 
bianco el espacio correspondiente en la hoja de 
respuestas. Como resultado, todas las respues- 
tas subsecuentes estAn desfasadas, con la res- 
puesta 20 anotada en la hoja de respuestas como 
reactivo 19 y asf sucesivamente. 

El examinador tambidn puede contribuir a 
los errores de medici6n en el proceso de apli- 
cacidn de la prueba. En una prueba aplicada de 
mancra oral, el hecho de que el examinador 
asiente dc mancra inconsciente con la cabeza, 
podrfa transmitirle a la persona examinada que 
va por buen camino, con lo cual se le gufa ha- 
cia la respuesta correcta. Por el contrario, un 
examinador lacdnico y abrupto podrfa intimi- 
dar a la persona, quien de otra manera estarfa 
dispuesta a proporcionar la respuesta correcta. 

CALIFICACI6N DC LA PRUEBA 

Cuando una prueba psicoldgica utiliza un for- 
mato diferente a aqudl de opcidn multiple, que 
se califica por medios mccAnicos, se requiere 
cicno grado de juicio para asignar puntos a las 
respuestas. Por fortuna, la mayorfa de las prue- 
bas tienen critcrios bien definidos para las res- 
pucstas que se dan a una dc las preguntas. Estas 


pautas ayudan a reducir al mfnimo el impacto 
del juicio subjetivo sobre la calificacidn (Gregory, 
1987). Sin embargo, la subjetividad dc la cali- 
ficacidn como fuente de error de medicidn puede 
constituir un grave problema en la valoracidn 
de pruebas proyeedvas o preguntas que requie- 
ren respuestas en forma de ensayo. Con res- 
pecto a las pruebas proyectivas, Nunnally 
(1978) sefiala que la persona que aplica una 
prueba proyectiva atraviesa por un cambio evo- 
lutivo en los criterios de calificacidn a medida 
que pasa el liempo, llcgando a considerar que 
un tipo particular de respuesta es cada vez mils 
patoldgico con cada encuentro. 

ERROR SISTEMATICO DE MEDIC16n 

Las fuentes de imprecisidn analizadas antes se 
conocen de manera colecdva como error no 
sistcmAtico de medici6n, lo cual implica que 
sus efectos sean inconsistcntcs e imposibles de 
predecir. Sin embargo, existe otro Upo de error 
de medicidn que consdtuye una verdadera som- 
bra oculta en la maquinaria psicomdtrica. Un 
error sistemAtico de medicidn surge cuando, sin 
que el autor lo sepa, la prueba mide de manera 
consistente alguna otra cosa que no es el rasgo 
para el cual se cre6. Supdngase, por ejemplo, 
que una escala que mide la introversidn social 
tambidn dctecta en forma inadvertida, y de ma¬ 
nera consistente, la ansiedad. En este caso, la 
ecuacidn que representa la relacidn entre pun- 
tuacioncs observadas, puntuaciones verdaderas 
y fuentes de error de medicidn serfa: 

X = V+e,+ a n 

donde X es la puntuacidn obtenida, V es la pun- 
tuacidn verdadera. e, es el error sistemitico debi- 
do al subcomponente de ansiedad y e, es el error 
no sistemdlico de mcdicidn descrito antes. 

Dado que, por definicidn, su presencia no 
se detecta de inicio, los errores sistemAticos 
de medici6n pueden constituir un problema 
significativo en el desarrollo de pruebas psico- 
Idgicas. Sin embargo, si los psiedmetras utili- 
zan los procedimientos apropiados de desa¬ 
rrollo de prueba que se analizan en el tema 4B 
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(Construction dc pruebas). el impacto de los 
errores sistemdticos de medicidn pueden redu- 
cirse en gran medida. A pesar de esto, los erro¬ 
res sistemdticos de medicidn sirvcn como 
recordatorio de que es muy diffcil, sino es que 
imposible, cvaluar de vcrdad un rasgo en aisla- 
miento puro, sin la influencia de otros. 

En esta secciOn se ha establecido el esque- 
ma bdsieo de las numerosas y diversas fuentes 
de error de medicidn. El lector podrfa revisar el 
tema 2B, Proceso de Aplicaci6n, que propor- 
ciona mds detalles acerca dc los multiples fac- 
tores que pueden virar el resultado de una prueba 
psicoldgica y, por lanto, introducir errores de 
medicidn. 


■ ERROR DE MEDICI6N 
Y CONFIABIUDAD 


Quizd para este momento el lector se estard 
prcguntando qud tiene que ver el error de me¬ 
dicidn con la confiabilidad. La conexidn mds 
obvia es que el error de medicidn reduce la 
confiabilidad o rcpetibilidad de los resultados 
de una prueba psicoldgica. De hecho, aquf se 
mostrard que la confiabilidad tiene una relacidn 
cstadfstica precisa con el error de medicidn. La 
confiabilidad y el error de medicidn son. en rea¬ 
lidad, sdlo formas diferentes de expresar la mis- 
ma prcocupacidn: £qud tan consistente es una 
prueba psicoldgica? La interdependencia de 
ambos conceptos quedard en claro si se pro- 
porciona un bosquejo adicional de la teorfa cld- 
sica de la medicidn. 

Una suposicidn crucial de la teorfa cldsica 
es que los errores no sistemdticos de medicidn 
aetdan como influences aleatorias. Esto no 
quiere decir que las fuentes de error de medi¬ 
cidn sean totalmente misteriosas e incompren- 
sibles en cada situacidn individual. En el caso 
de una persona, podrfa sospecharse que su pun- 
tuacidn en retencidn de dfgitos refleja un error 
ligeramente negativo de medicidn producido 
por interferencia auditiva de alguien que haya 
tosido en el pasillo, durante la presentacidn del 
quinto reactivo. De la misma manera, podrfa 


conjeturarse que otra persona recibid el benefi- 
cio dc un error positivo de medicidn al ver a 
travds de un espejo. colocado detrds del exami- 
nador, la respuesta correcta al reactivo 9 en 
una prueba de informacidn. Asf. el error de me¬ 
dicidn no necesariamente es un acontecimiento 
misterioso en cada caso individual. 

Sin embargo, cuando se examinan las pun- 
tuaciones de prueba de un grupo de personas, las 
causas del error de medicidn son increfblcmente 
complejas y diversas. En este contexto, los erro¬ 
res no sistemdticos de medicidn se comportan 
como variables aleatorias. La teorfa cldsica acep- 
(a este cardcler aleatorio del error de medicidn 
como una suposicidn axiomdtica. 

Debido a que son sucesos aleatorios, los 
errores no sistemdticos dc medicidn tienen la 
misma probabilidad de ser positives o negati¬ 
ves y, por tanto, tendrdn un promedio de cero 
cuando se trate de un grupo grande de sujetos. 
Asf, una segunda suposicidn es que la media 
del error de medicidn es igual a cero. La teorfa 
cldsica tambidn supone que los errores dc 
medicidn no se correlacionan con las puntua- 
ciones verdaderas. Esto hace sentido a nivel 
intuitive: si las puntuaciones de error se rela- 
cionaran con otra puntuacidn, esto sugerirfa que 
son sistemdticas mds que aleatorias, lo cual vio- 
larfa la suposicidn esencial de la teorfa cldsica. 
Por ultimo, tambidn se supone que los errores 
de medicidn no se correlacionan con errores en 
otras pruebas. 

Se pueden resumir las caracterfsticas prin- 
cipales de la teorfa cldsica como sigue (Gulliksen, 
1950, capftulo 2): 

1. Los errores de medicidn son aleatorios. 

2. La media del error de medicidn es = 0. 

3. Las puntuaciones verdaderas y los errores 
no se correlacionan: r» = 0. 

4. Los errores en diferentes pruebas no se 
correlacionan r„ = 0. 

Si se parte de estas suposiciones, es posible 
desarrollar varias implicaciones importantes 
para la confiabilidad y la medicidn. (Los si- 
guientes puntos se basan en la suposicidn 
optimista dc que los errores sistemdticos de 
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medicitin son mfnimos o incxistentes para el 
instrumento en cucsti6n.) Por ejemplo, se sabe 
que cualquier prueba aplicada a un gran ndme- 
ro de personas mostrard una variabilidad de las 
puntuaciones obtenidas que puede expresarse 
en tdrminos cstadfsticos como una varianza, es 
decir, a 2 . El valor de la teorfa cldsica es que nos 
permite dividir la varianza de las puntuaciones 
obtenidas en dos fuentes independientes. En 
tlrminos especfficos, puede dcmostrarse que 
la varianza de las puntuaciones obtenidas es 
simplemente la varianza de las puntuaciones 
verdaderas mds la varianza de los errores de 
tnedicidn: 

o* ■ a/ ♦ o, J 

Referimos al lector interesado a Gulliksen 
(1950. capftulo 3), para los detalles sobrc el 
cdlculo. 

La fdrmula que se muestra antes demues- 
tra que las puntuaciones de prueba varfan como 
resultado de dos factores: la variabilidad en las 
puntuaciones verdaderas y la variabilidad de- 
bida al error de medicidn. La implicacidn ob- 
via es que los errores de medicidn contribuyen 
a la inconsistencia de las puntuaciones obteni¬ 
das en la prueba; los resultados no continuar&n 
siendo estables si la prueba se aplica de nuevo. 

ICOEFICIENTE DE CONRABIUDAD 


Finalmente, se estd en posicidn de establecer la 
relacidn precisa entre confiabilidad y error de 
medicidn. Para cste momento, el lector deberfa 
haber disccrnido que la confiabilidad expresa 
la influencia relativa de las puntuaciones ver¬ 
daderas y de error en las puntuaciones obteni¬ 
das en la prueba. En tdrminos matemdticos mds 
precisos. el coeflciente de confiabilidad (r a ) 
es la proporcidn entre la varianza de la puntua- 
cidn vcrdadera y la varianza total de las pun¬ 
tuaciones de prueba. Es decir: 


o de manera equivalentc: 

, °r 2 

Obsdrvese que el rango de valores potenciales 
de r a puede obtenerse del andlisis de la fdrmu- 
la expresada antes. Considdrese qud sucede 
cuando la varianza debida al error de medicidn 
(ct c 2 ) es muy pequena, cercana a cero. En ese 
caso, el coeflciente de confiabilidad (rn) se acer- 
ca a un valor de (ot^/ot 2 ) o 1.0. En el extre- 
mo opuesto, donde la varianza debida a un error 
de medicidn es muy grande, el valor del coefi- 
ciente de confiabilidad se vuelve muy peque- 
fio, accrc4ndo.sc a un Ifmite tedrico de 0.0. En 
suma, una prueba que tiene confiabilidad total- 
mente nula (con un error de medicidn de gran 
tamaflo) producird un coeflciente de confia¬ 
bilidad cercano a 0, mientras que una prueba 
completamente conflable (sin error de medi- 
cidn) producird un coeflciente de confiabilidad 
de 1.0. Asf, el rango posible del coeflciente de 
confiabilidad se encuentra entre 0 y 1.0. En la 
prdctica, todas las pruebas producen un coefl¬ 
ciente de confiabilidad que se coloca en algiin 
sitio intermedio, pero entre mds cercano sea el 
valor de r„ a 1.0, mejor. 

En un sentido literal, r a indica la propor¬ 
cidn de varianza en las puntuaciones obtenidas 
en la prueba, que se explica por la variabili¬ 
dad en las puntuaciones verdaderas. Sin embar¬ 
go, la fdrmula para el coeflciente de confiabilidad 
rxx indica tambidn una interpretacidn adicional. 
El lector recordard que las puntuaciones obte¬ 
nidas se simbolizan con la letra X. De la misma 
manera, los subfndices en el sfmbolo para el 
coeflciente de confiabilidad signiflean que r a 
es un fndice de la consistencia potencial o real 
de las puntuaciones obtenidas. Asf, las pruebas 
que tienen cantidades mfnimas de error de me- 
dicidn, producen puntuaciones consistentes y 
conflables; sus cocficientcs de confiabilidad son 
cercanos a 1.0. Por el contrario, las pruebas que 
reflejan grandes cantidades de error de medi- 
ci6n producen puntuaciones inconsistentes y 
no confiables; sus coeflcientes de confiabilidad 
son cercanos a 0.0. 
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Hasta cstc punto, el andlisis acerca de la 
confiabilidad ha sido conceptual mds que prdc- 
tico. Se ha senalado que la confiabilidad se re- 
fiere a la consistencia de la medicidn; que dsta 
se reduce en la medida en que los errores de 
medicidn dominan la puntuacidn obtenida; y 
que un fndice estadfstico de la confiabilidad, el 
coeficiente de confiabilidad. pucdc variar en- 
tre 0 y 1.0. Pero ^cdmo se calcula una medida 
estadfstica de la confiabilidad? Este tema se 
cnfoca de manera indirecta, revisando primero 
una herramienta estadfstica esencial, el coefi¬ 
ciente de correlacidn. El lector descubrird que 
el coeficiente de correlacidn, un fndice numd- 
rico de la relacidn lineal cntre dos conjuntos de 
puntuaciones, cs una herramienta excclcnte para 
evaluar la consistencia o repetibilidad de las 
puntuaciones de prueba. Sc proporciona una 
breve actualizacidn acerca del significado de 
la correlacidn antes de proceder a un resumen 
de los mdtodos para estimar la confiabilidad. 

Hcoerciente PE CORRELAC16N 

En su aplicacidn mils comun, un coeficiente de 
correlacidn (r) expresa el grado de relacidn li¬ 
neal entre dos conjuntos de puntuaciones obte- 
nidas de las mismas personas. Los coeficientes 
de correlacidn pueden asumir valores que van de 
-1.00 a +1.00. Un coeficiente de correlacidn 
de +1.00 significa una rclacidn lineal perfecta 
entre los dos conjuntos de puntuaciones. En 
particular, cuando dos medidas tienen una co- 
rrelacidn de +1.00, la clasificacidn por rangos 
de los sujetos es iddntica en ambos conjuntos de 
puntuaciones. Lo que es mds, cuando los datos 
individuates (uno de los cuales representa un par 
de puntuaciones de un solo sujeto) se represen- 
tan en una grdfica de dispersidn (figura 3-10a), 
se conforman a una lfnea perfcctamente recta 
con una inclinacidn ascendente. Un coeficiente 
de correlacidn de -1.00 significa una rclacidn 
igualmente fuerte, pero con una corresponden- 
cia inversa: la punluacidn mds alta en una va¬ 
riable corresponde a la puntuacidn mds baja en 
la otra y viceversa. En este caso, los datos de 


cada individuo se conforman a una lfnea perfec- 
tamente recta con una inclinacidn desccndente 
(figura 3-10b). Las correlacioncs de +1.00 y 
-1.00 son muy poco comunes en la investiga- 
cidn psicoldgica y en general denotan una con- 
clusidn trivial. Porejemplo, si en dos ocasiones 
en rdpida sucesidn contamos el numero de Ic- 
tras en el nombre de 100 estudiantes, estos dos 
conjuntos de “puntuaciones” mostrarfan una 
correlacidn de +1.00. 

En general, las correlaciones negativas son 
el resultado de la manera en que se calificd a 
una de las dos variables. Por ejemplo, las pun¬ 
tuaciones en el Category Test (Prueba de Catc- 
gorfas; Reitan y Wolfson, 1993) se presentan 
como errores comctidos, mientras que los re- 
sultados en la Prueba de Matrices Progresivas 
de Raven (Raven, Court y Raven, 1983, 1986) 
se muestran como numero de reactivos correc- 
tos. Las personas que obtienen una alta pun¬ 
tuacidn en la Prueba de Categorfas (muchos 
errores) tendrdn mayor probabilidad de obtener 
una baja puntuacidn en la prueba de Matrices 
Progresivas (pocos aciertos). Asf, sc esperarfa 
una correlacidn negativa sustancial para las 
puntuaciones en estas dos pruebas. 

Considdrese la grdfica de dispersidn en la 
figura 3-10c, que podrfa representar la estalu- 
ra y peso hipotdticos de un gmpo de personas. 
Como podrd ver el lector, la cstatura y peso tie¬ 
nen una relacidn fuerte, pero no perfecta, entre 
sf. Las personas altas tienden a pesar mds, las 
personas de baja estatura tienden a pesar me- 
nos, pero existen algunas excepciones. Si se 
calculara el coeficiente de correlacidn entre 
estatura y peso —una tarea estadfstica simple 
que se explica mds adelante— se obtendrfa un 
valor de aproximadamente +0.80, locual indica 
una relacidn positiva fuerte entre estas medidas. 

Cuando dos variables no tienen relacidn, 
la grdfica de dispersidn asume una forma inde- 
finida, parecida a una mancha, y el coeficiente 
de conelacidn estd ccrcano a cero (figura 3-10d). 
Porejemplo, es muy probable que en una mues- 
tra de adultos, la correlacidn entre tiempo de 
reaccidn y peso sea muy cercana a cero. 

Por ultimo, cs importante comprender que 
el coeficiente de correlacidn es independiente 
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Flgura 3-10. Diagrama do dispersion quo represonta 
dllerentos grados de correlackin. 

del medio. Por ejemplo, se puede encontrar una 
correlacidn de +1.00 entrc dos aplicaciones de 
la misma prucba, aun cuando existan diferen- 
cias mcdias significativas entrc la prcpmeba y 
la posprueba. En resumen, la correlacidn pcr- 
fecta no implica puntuaciones iddnlicas en 
ambas para cada individuo examinado. Sin em¬ 
bargo, la correlaci6n perfecta sf significa una 
clasificacidn por rangos perfectamente ordena- 
da de la preprueba a la posprueba, como se ana- 
Iiz6 antes. 


COERCIENTE DE CORRELACJ6N 
COMO COEROENTE DE 
CONFIABIUDAD 

Un empleo del coeficicnte de conrelacibn consis- 
te en cstimar la consistencia de las puntuaciones 
en una prueba psicoldgica. Si los resultados de 
prueba son sumamcnte consistentes, entonces 
las puntuaciones de las personas que realizan la 
prueba en dos ocasiones se correlacionar&n en 
gran medida e incluso se acercartin al Ifmite 


tedrico superior de +1.00. En cste contexto, el 
coeficiente de correlacidn tambien es un coefi- 
ciente de confiabilidad. Aunque el c&lculo de 
la r de Pearson no hace referenda a la teorfa 
de las puntuaciones verdaderas y de error, el 
coeficiente de correlacidn sf lo hace, al reflejar 
la proporcidn de varianza en las puntuaciones 
obtenidas que sc explica por la variabilidad en 
las puntuaciones verdaderas. Asf, en algunos 
contextos, un coeficiente de correlacidn es un 
coeficiente de confiabilidad. 

Este andlisis introduce un mdtodo para es- 
timar la confiabilidad de una prueba: aplicar el 
inslrumento dos veces al mismo grupo de per¬ 
sonas y calcular la corrdacidn entre ambos con- 
juntos de puntuaciones. El enfoque lest-relesl 
es muy comun en la evaluacidn de la confia¬ 
bilidad, pero tambidn existen varias otras es- 
trategias. A medida que se revisen los mdtodos 
para estimar la confiabilidad que sc describen 
adelante, puede ser que el lector se confunda 
temporalmcnle por la aparente di versidad de los 
enfoques. De hecho, los diferentes metodos 
caen dentro de dos amplios grupos, a saber, los 
enfoques de estabilidad temporal (que miden 
de mancra dirccla la consistencia de las puntua¬ 
ciones de prueba) y los enfoques de consisten¬ 
cia interna (que dependen de una sola aplicacidn 
de la prueba para estimar la confiabilidad). Debe 
tenerse en mente que todos los mdtodos ecldc- 
ticos se vinculan por un tema comun: la confia¬ 
bilidad siempre es un intento por estimar la 
probable precisidn o repetibilidad de las pun¬ 
tuaciones de prueba. 


B conrabiudad COMO 
ESTABIUDAD TEMPORAL 


CONRABIUDAD TEST-RETEST 

El mdtodo rods sencillo para determinar la 
confiabilidad de las puntuaciones de una prueba 
consiste en aplicar dos veces la misma prue¬ 
ba al mismo grupo de sujetos heterogdneos y re¬ 
presentatives. Si la prueba es del todo confiable, 
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la segunda puntuacidn dc cada persona se po- 
drf pronosticar perfectamente a partir de la pri- 
mera. En muchos tipos de pruebas, en particular 
de capacidad y de aprovechamiento. podrfa es- 
perarse que, en general, los sujetos obtengan 
puntuaciones un tanto mejores en la segunda 
ocasidn, debido a la pr&tica, maduracidn, esco- 
laridad u otros efectos interventorcs que ocurran 
entre la preprueba y la posprueba. Sin embar¬ 
go, en tanto la segunda puntuacidn se corre- 
lacione en gran medida con la primera, la 
existencia de los efectos de la pr&ctica, la ma- 
duracidn o el tratamiento no arrojar^ dudas so- 
bre la confiabilidad de una prueba psicoldgica. 

En la figura 3-11 se presenta un ejemplo 
de un coeficiente de confiabilidad calculado 
como coeficiente de correlacidn test-retest. En 
este caso, se aplicd a 60 sujetos la Finger 
Tapping Test (FIT, Prueba de golpeteo con los 
dedos) en dos ocasiones separadas por una se- 
mana (Morrison, Gregory y Paul, 1979). La 
FTT, un componente de la baterfa de pruebas 
neuropsicoldgicas Halstead-Reitan (Reitan y 
Wolfson, 1983), es una medida relativamente 
pura de la velocidad motora. A travds de un 
aparato estandarizado de conteo mecdnico, se 
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Pruaba da oolpalao da dadoa, 
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Figura 3-11. Diagrama de dlsperskJn que revela un co- 
eflcfante de oonllablidad de 0.80. 

Fuanta: Basado en da los de Morrison, M. W„ Gregory, 
R. J. y Paul, J. J. (1979). Reliability of the Finger Tapping 
Test and a note on sex differences. Perceptual and 
Motor Skills, 48. 139-142. 


instruye al paciente a que golpetee con el dedo 
fndice tan r&pido como pueda durante 10 se- 
gundos. Este procedimiento se continua hasta 
que cinco ensayos seguidos muestran resulta- 
dos consistentes. El procedimiento se repite 
para la mano no dominante. La puntuacidn para 
cada mano es el promedio de los cinco ensayos 
consecutivos. 

La correlacidn entre las puntuaciones de 
las aplicaciones repetidas de esta prueba resul- 
ta ser de aproximadamente 0.80. £ste es el 
extremo inferior de aceptabilidad para los co- 
eficientes de confiabilidad, que por lo general 
se encuentran entre .80 y .90. Adelante se ana- 
lizan con mayor detalle las normas para la 
confiabilidad. 


CONHABHJDAO DE FORMAS ALTERNAS 

En algunos casos, los autorcs elaboran dos for¬ 
mas de la misma prueba. Estas formas alter- 
nas se construyen de manera independiente 
para satisfacer las mismas especificacioncs, con 
frecuencia desde el nivel de cada uno de los 
reactivos. Asf, estas formas incorporan conte- 
nido similar y cubren el mismo rango y nivel 
de dificultad en los reactivos, adcmls de tencr 
propiedades estadfsticas y normativas simila- 
res. Por ejemplo, cuando se aplican de manera 
contrabalanceada al mismo grupo de indivi- 
duos, las medias y desviaciones estdndar de las 
formas altemas son, por lo comiin, bastante 
comparables. 

Los estimados de la confiabilidad de las for¬ 
mas altemas se obtienen de aplicar ambas 
formas al mismo grupo y correlacionar los dos 
conjuntos de puntuaciones. Este enfoque tiene 
mucho en comtin con los mdtodos test-retest 
—ambas estrategias implican dos aplicacio¬ 
nes de prueba a las mismas personas con un 
intervalo intermedio. Para ambos enfoques, se 
esperarfa que los cambios interventores en moti- 
vacidn y las diferencias individuates en cuanto 
a la cantidad de mejorfa producirfan fluctua- 
ciones en las puntuaciones de prueba y, por 
tanto, reducirfan en cierta medida los estima¬ 
dos de confiabilidad. Asf, los estimados de 
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confiabilidad test-retest y dc formas altemas 
comparten una considerable semejanza concep¬ 
tual. 

Sin embargo, existe una diferencia funda¬ 
mental entre estos dos enfoques. La metodolo- 
gfa de formas altemas introduce diferencias en 
la muestra de reactivos que representan una 
fuente adicional de varianza debida al error. Es 
decir, algunas personas pueden tener un mejor 
o un pcor desempeno en una forma de la prue- 
ba, debido a la muestra particular de reactivos. 
Auncuando ambas formas puedan tener el mis- 
mo nivel de dificultad, en promedio, algunos 
sujetos pueden encontrar que una forma es bas- 
tante mis diffcil (o ficil) que la otra, debido a 
que los reactivos que se supone son paralelos 
no son igualmente familiares para todos los 
individuos. Obs6rvese que las diferencias en 
la muestra de reactivo no son una fuente de 
varianza de error en el enfoque test-retest, por- 
que se utilizan reactivos iddnticos en ambas 
aplicaciones. 

Las formas altemas de una prueba tambiin 
son bastante costosas —al casi duplicar los cos- 
tos de publicaci6n de una prueba y de coloca- 
cidn en el mercado. Debido al aumento en costo 
y tambidn por las dificultades psicomdtricas de 
producir formas verdaderamente paralclas, cada 
vez se publican menos pruebas en este formato. 


I CONFIABILIDAD COMO 

CONSISTENCIA INTERNA 

Volvcmos ahora nuestra atencidn hacia ciertas 
maneras fascinantes de estimar la confiabilidad 
de una prueba individual sin desarrollar formas 
altemas y sin aplicar la prueba dos veces a las 
mismas personas (Feldt y Brennan. 1989). El 
primer enfoque correlaciona los resultados de 
una mitad de la pmeba con los de la otra mitad 
y. de manera apropiada, se denomina confiabili¬ 
dad de divisidn en mitades. El segundo enfoque 
analiza la consistencia interna de los reactivos 
individuales de prueba. En este enfoque, el 
psiedmetra busca determinar si dstos tienden a 
mostrar una interrelacidn consistente. Por ulti¬ 


mo, debido a que algunas pruebas son menos 
que perfectamente confiables a causa de las di¬ 
ferencias entre calificadores, tambidn se revisa 
el tema relacionado de la confiabilidad entre 
calificadores. 

CONFIABILIDAD POR MITADES 

Se obtiene un estimado de la confiabilidad por 
mitades al correlacionar los pares de puntua- 
ciones obtenidas de mitades equi valentes de una 
pmeba aplicada sdlo una vez a una muestra re- 
presentativa de examinandos. La Idgica de la 
confiabilidad por mitades es sencilla: si las pun- 
tuaciones de las dos mitades de pmeba, obteni¬ 
das de una sola aplicacidn, mucstran una fuerte 
correlacidn, entonces las puntuaciones de las 
dos pmebas completas, obtenidas en dos apli¬ 
caciones independientes (el enfoque tradicio- 
nal para evaluar la confiabilidad), tambifn 
deberfan revclar una fuerte correlacidn. 

Es tfpico que los psiedmetras considercn 
al mdtodo por mitades como complementario 
del enfoque de patrdn oro que es el mdtodo del 
test-retest. Por ejemplo, en la estandarizacidn 
del WAIS-III, la confiabilidad de la mayorfa de 
las escalas se establecid a travds del enfoque 
test-retest y del enfoque por mitades. En gene¬ 
ral, estos dos estimados de la confiabilidad son 
similares, aunque es frecuente que los enfoques 
por mitades produzcan estimados mds altos de 
la confiabilidad. 

Una justificacidn para el enfoque por mi¬ 
tades es que los problemas logfsticos o de costo 
excesivo pueden hacer poco prdctica la obten- 
ci6n de un segundo conjunto dc puntuaciones 
de pmeba con los mismos individuos exami- 
nados. En este caso, un estimado de la confia¬ 
bilidad por mitades es lo unico disponible y con 
seguridad es mejor que no tener ningtin esti¬ 
mado. Otra justificacidn para este enfoque es 
que el mdtodo test-retest puede ser engafioso 
en ciertos casos. 

Por ejemplo, algunas pmebas de capacidad 
son propensas a efectos grandes pero inconsis- 
tentes debidos a la pr^ctica —como cuando los 
individuos aprenden conceptos debido a la rea- 
limentacidn dada como parte del procedimiento 
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estandarizado de prucba. Cuando las cfectos 
de la priictica son grandes y variables, la clasi- 
ficacidn por rango de las puntuaciones de una 
segunda aplicacidn sdlo tendrd, en el mejor de 
los casos, una modcsta asociacidn con la clasi- 
ficacidn por rango de las puntuaciones de la 
primera aplicacidn. Para estos tipos de instru- 
mentos, cl coeficiente de confiabilidad test-retest 
podrfa scr engafiosamentc bajo. 

Por ultimo, los enfoques test-retest tambidn 
pueden producir estimados engafiosamente ba- 
jos de confiabilidad si el rasgo a medir es co- 
nocido por tener fluctuaciones rdpidas (p. ej. t 
ciertas medidas de estado de dnimo). 

El principal desaffo de la confiabilidad por 
mitades consiste en dividir la prueba en dos mi- 
tades aproximadamentc cquivalentes. En la ma¬ 
yor parte de las pruebas —en especial aqudllas 
cuyos reactivos se clasifican con base en el ni- 
vel de dificultad— la primera mitad es mds fd- 
cil que la segunda. No se esperarfa que los 
individuos obtengan puntuaciones equivalen- 
tes en estas dos porciones, de modo que este 
enfoque para dividir la prueba se utiliza pocas 
ocasiones. El mdtodo mds comun para obtener 
la divisidn por mitades estriba en comparar las 
puntuaciones de los reactivos pares y nones de 
la prueba. Este procedimiento funciona particu- 
larmente bien cuando los reactivos se ordcnan 
scgun el grado aproximado de dificultad. 

Ademds de calcular una r de Pearson entre 
las puntuaciones de las dos mitades equivalen- 
tes de la prueba, el cdlculo de un coeficiente de 
confiabilidad por mitades implica un paso adi- 
cional: ajustar la confiabilidad por mitades uti- 
lizando la fdrmula Spearman-Brown. 

f6rmula spearman-brown 

Obsdrvese que el m^todo por mitades propor- 
ciona un estimado de la confiabilidad para un 
instrumento de la mitad de longitud que la 
prueba completa. Aunque existen algunas ex- 
cepciones, en general una prueba mis corta 
es menos confiablc que una mds larga. Eslo es 
especialmente cicrto si. en comparacidn con la 
forma mds corta. la prueba mds larga incorpora 
un conlcnido equivalente y de dificultad similar 


Cuadro 3-7. Comparaclon de las 
confiabilidades por mitades y 
las confiabilidades Spearman-Brown 
correspondientes 


Confiabilidad 
por mitades 

Confiabilidad de 
Spearman-Brown 

.5 

.67 

.6 

.75 

.7 

.82 

.8 

.89 

.9 

.95 


en los reactivos. Asf. la r de Pearson entre las 
dos mitades de una prueba subestimard por lo 
general la confiabilidad del instrumento cotn- 
plcto. Se necesita un mdtodo para obtener la 
confiabilidad de toda la prueba con base en el 
coeficiente de correlacidn por mitades. 

La fdrmula Spearman-Brown proporcio- 
na el ajuste apropiado: 


En esta fdrmula, rsa es el estimado de confia¬ 
bilidad de la prueba completa. calculado segun 
el mdtodo Spearman-Brown, mientras r, m „es la 
confiabilidad por mitad de prueba. El cuadro 3-7 
muestra posibles correlacioncs por mitades junto 
con los coeficientes de confiabilidad Spearman- 
Brown correspondientes para toda la prueba. Por 
ejemplo, al utilizar la fdrmula Spearman-Brown, 
se puede determinar que una confiabilidad por 
mitades de .70 es equivalente a una confiabi¬ 
lidad cstimada para toda la prueba de .82. 

CRfTlCA AL ENFOQUE POR MITADES 

A pesar de que el enfoque por mitades es muy 
utilizado, ha recibido crfticas debido a su falta 
de precisidn: 

En lugar do proporcionar un solo coetlclenle para 
la prueba, el procedimiento nos da dtterentes 
coeficientes depend iendo de cuAles reactivos se 
agrupan cuando la prueba se divide en dos partes. 
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Si una mitad puede dar un mayor coeficiente quo 
olra, se puede tener poca (e en cualquier re- 
sultado que se oblenga de una sola mitad 
(Cronbach, 1951). 

^Por qud dependcr de una sola divisidn? ^Por qud 
no tomar un valor mils tipico, como la media dc 
|os coeficientes por mitades que resulten de todas 
las posibles divisiones de la prueba? Cronbach 
( 1951 ) dcfendid justo ese enfoque cuando pro- 
puso una fdrmula general para estimar la confia- 
bilidad de una prueba psicoldgica. 


COEFICIENTE ALFA 

Como los propuso Cronbach (1951), y lo ela- 
boraron de manera subsecucntc otros autores 
(Novick y Lewis, 1967; Kaiser y Michael, 
1975), el coeficiente alfa(a) puede conside¬ 
rate como la media de todos los posibles 
coeficientes por mitades, corregidos segun la 
fdrmula Spearman-Brown. La fdrmula para cl 
coeficiente a es: 



donde r a es el coeficiente alfa, N es el numero 
de rcactivos, aj 2 es la varianza de un reactivo, 
Iq, 2 es la sumatoria de las varianzas de todos 
los reactivos y ct 2 es la varianza de las puntua- 
cioncs totales de pmeba. Como ocurre con todos 
los estimados de confiabilidad, el coeficiente a 
puede variar entre 0 y 1.00. 

El coeficiente a es un fndice de la consis¬ 
tence interna de los reactivos; es decir, de su 
tendencia a correlacionarse en sentido positivo 
entre sf Dado que una prueba o escala con alta 
consistencia interna tambidn tenderd a mostrar 
estabilidad en sus puntuaciones en un enfoque 
test-retest, el coeficiente a es, por tanto, un es- 
limado util de la confiabilidad. 

Por tradicidn se ha considerado que el co¬ 
eficiente a es un fndice de la unidimensiona- 
lidad; es decir, del grado en que una prueba o 
escala mide un solo factor. Los andlisis rccien- 
tes de Cortina (1993) y Schmitt (1996) sirven 
para esclarecer este error conceptual. Con se- 
guridad el coeficiente a es un fndice dc la inte- 


rrelacidn de los rcactivos individuales, pero ello 
no es sindnimo de la unidimensionalidad de 
aquello que mide la prueba o escala. De hccho, 
es posible que una escala mida dos o mas fac- 
tores diferentes y, sin embargo, posea un coefi¬ 
ciente a muy fuerte. Schmitt (1996) da un 
ejemplo de una prueba de seis rcactivos en la 
que los primeros ires se intercorrelacionan en 
.8, los ultimos tres reactivos (ambidn tienen una 
correlacidn de .8 entre sf, mientras que las co- 
rrelaciones entre los dos conjuntos de tres 
reactivos sdlo alcanzan .3 (cuadro 3-8). Aun- 
que dsta es, dc manera irrefutable, una fuerte 
prueba de la existencia dc dos factores, jel va¬ 
lor del coeficiente a resulta ser dc .86! Para 
este tipo de prueba, es probable que el coefi¬ 
ciente a produzca una sobrestimacidn dc la 
confiabilidad test-retest. 6sta es una de las ra- 
zones por las que los psiedmetras consideran a 
los enfoques test-retest como esenciales para 
la valoracidn de la confiabilidad. Con toda se- 
guridad, el enfoque de divisidn por mitades, en 
general, y cl coeficiente a en particular, son 
abordajes valiosos a la confiabilidad, pero no 
pueden sustituir al sentido comun del enfoque 
test-retest : cuando la misma prueba se aplica 
en dos ocasiones a una mucstra representativa, 
^las personas evaluadas obtienen la misma asig- 
nacidn rclativa de puntuaciones? 


Cuadro 3-8. Prueba de sels reactivos 
con dos factores y un fuerte 
coeficiente a 


Variable 

1 

2 

3 

4 

5 6 

1 

— 





2 

.8 

— 




3 

.8 

.8 

— 



4 

.3 

.3 

.3 

— 


5 

.3 

.3 

.3 

.8 

— 

6 

.3 

.3 

.3 

.8 

.8 — 


Note: coeficiente a » 86 

Fuente: Reimpfoso con aulonzaddn de Schmitt, N (1996) Uses 
and abuses ol coelfoent alpha Psychological Assessment, 8. 
350-353 
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EST1MADO KUDER-RICHARDSON 
DE LA CONRABIUDAD 

Cronbach (1951) ha demostrado que el coefi¬ 
ciente a es la aplicacidn general de una fdrmu- 
la mis especffica dcsarrollada antes por Kuder 
y Richardson (1937). Su fdrmula se conoce cn 
tcrminos generales como fdrmula Kuder- 
Richardson 20 o, simplcmcntc, KR-20, en rc- 
ferencia al hecho de que fue la vigdsima de una 
larga serie de derivaciones. La fdrmula KR-20 
es pertinente para el caso especial donde cada 
reactivo de prueba se califica con 0 o 1 (p. ej., 
incorrecto o correcto). La fdrmula es: 

donde 

N = numcro de reactivos en una prueba, 
& = varianza de las puntuacioncs en la 
prueba total, 

p = proporcidn de examinandos que ob- 
tienen cada reactivo correcto, 
q - pro pore i6n de examinandos que ob- 
ticnen cada reactivo incorrecto. 

El coeficiente a extiende el mdtodo Kuder- 
Richardson a los tipos de pruebas con reactivos 
que no se califican como 0 o 1. Por cjemplo, el 
coeficiente a puede utilizarsc con una escala 
de actitud en la que las personas examina- 
das indican en cada reactivo si est&n muy de 
acuerdo, de acucrdo, en desacuerdo o muy en 
dcsacucrdo. 

CONFIABIUDAD INTERCAURCADORES 

Algunas pruebas permiten una gran cantidad 
de juicio por parte del examinador en cuanto a 
la asignacidn dc puntuaciones. Con toda segu- 
ridad, las pruebas proyectivas caen dentro de 
esta categorfa, al igual que las pruebas de desa- 
rrollo moral y de creatividad. En la medida en 
que el calificador puede ser un importante fac¬ 
tor en la confiabilidad de estos instrumentos. 


es imperativo informar sobre la confiabilidad 
intercalificadores. El c^lculo de la confiabtli- 
dad intercalificadores es un procedimiento 
muy sencillo. Dos o m6s examinadores califi¬ 
can de manera independiente una muestra de 
las pruebas y entonces se correlacionan las pun¬ 
tuaciones por pares de examinadores. Por lo 
comun, los manuales de prueba informan so¬ 
bre el entrenamiento y experiencia requeridos 
por parte de los examinadores y despu£s enu- 
mcran los coeficientes representatives de co- 
rrclacion intercalificadores. 

La confiabilidad intercalificadores comple- 
menta otros estimados de confiabilidad, pero 
no los sustituye. De todas maneras, serfa apro- 
piado evaluar la confiabilidad test-retest y otros 
tipos de confiabilidad en una prueba que se ca¬ 
lifica de manera subjetiva. En el cuadro 3-9 se 
proporciona un rtipido resumen accrca dc los 
mdtodos para estimar la confiabilidad. 

tQUi TPO DE CONRABIUDAD 
ES EL APROPIADO? 

Como se senald, incluso cuando una prueba tie- 
ne s6lo una forma, cxisten numerosos mdtodos 
para evaluar la confiabilidad: test-retest , por 
mitades, coeficiente a y mdtodos intercalifi¬ 
cadores. Para las pruebas que poseen dos for¬ 
mas, se puede afiadir un quinto mdtodo: la 
confiabilidad de formas altemas. iCufil m£to- 
do es el mejor? ^Cudndo deberfa utilizarsc un 
mltodo y no otro? Para responder a estas pre- 
guntas se necesita conoccr la naturaleza y pro- 
pdsito de la prueba individual en cuestidn. 

Para las pruebas disefiadas para aplicarse a 
los individuos en mds de una ocasidn, serfa ra- 
zonable esperar que la prueba demostrara 
confiabilidad a travds del tiempo —en este caso 
es apropiada la confiabilidad test-retest. Para 
las pruebas que afirman tener pureza factorial, 
el coeficiente a serfa esencial. En contraste, las 
pruebas factorialmente complejas no dar&n bue- 
nos resultados con medidas de la consistencia 
interna. Por tanto, el coeficiente a no es un fn- 
dice apropiado de la confiabilidad para todas 
las pruebas, sino que se aplica s6lo a medidas 
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Cuadro 3-9. Breve sinopsis de los metodos para evaluar la confiabilidad 


Mitodo 

Niim. de formas 

Niim. de sesiones 

Fuentes de varianza 
de error 

Test-retost 

1 

2 

Cambios a travOs del 
tiempo 

Formas allemas (inmediata) 

2 

1 

Muestra de reactivos 

Formas altemas (demorada) 

2 

2 

Muestra de reactivos 
Cambios a travds del 
tiempo 

Division por mllados 

1 

1 

Muestra de reactivos 
Naturaleza de la divi¬ 
sion 

Coettolente a 

1 

1 

Muestra de reactivos 
Heterogenaldad de 
prueba 

Intercalificadores 

1 

1 

Diferencias entre ca- 
lilicadores 


quc estdn discnadas para evaluar un solo fac¬ 
tor. Los mdtodos de divisidn cn mitades fun- 
cionan bien con instrumentos cuyos reactivos 
se han ordenado de manera cuidadosa segun su 
nivei de dificultad. Por supuesto, la confiabi- 
lidad intercalificadores es apropiada para cual- 
quier prueba que requiera de subjetividad cn la 
calificacidn. 

Es comun que los manuales de prueba se- 
nalen multiples fuentes de informacidn sobre 
la confiabilidad. Por cjemplo, el Manual del 
WAIS-1II (Tulsky, Zhu y Ledbetter, 1997) de- 
(alla las confiabilidades de divisidn cn mitades 
de la mayorfa de las subpruebas y tambidn pro- 
porciona coeficicntcs test-retest para todas las 
subpruebas y puntuacioncs de CL El manual 
tambidn cita informacidn relacionada con la 
confiabilidad dc formas altemas —informa de 
correlaciones entre el WAIS-III y su predece- 
sor. el WA1S-R. 

A fin dc separar la varianza dc error cn sus 
panes componentes, serd necesario calcular va- 
rios coeficientes de confiabilidad. Aunque es 
diffcil llegar a datos precisos en el mundo real, 
con una base tedrica se puede dividir la varia- 
bilidad de las puntuaciones en sus componentes 
verdaderos y de error, como se representa en la 
figure 3-12. 


Varianza da error 

Varianza vordadera: lacloraa que contrlbuyan 

cantldad duradera y real a la Imprecision do 
do un raago la medlddn 


80% 


20 % 



gr — 

Mueetreo 
del conlonldo 
10 % 


Cambios Dlferonclaa 
a lo largo InlercaHllcadorea 
del tlempo 


8% 


Nola: Los resultados son simiares a lo que podrla enconlrarse 
si diterentes examinadores aplicaran formas allernalivas de 
una prueba individual de intetigencia a la misma persona 


Figure 3-12. Fuentes de varianza en una prueba 
hipotOtica. 

MODELO DE MUESTREO 
DEL DOMINIO Y LA TEORfa 
DE LA CAPAC1DAD 
PARA LA GENERAUZACI6N 



La teorfa cliisica resumida antes es la base para 
la mayorfa de los aniilisis dc confiabilidad que 
se citan en los informes de investigacidn y en 
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los manuales de prueba. Otro enfoque conoci- 
do como muestreo del dominio proporciona una 
alternativa y un concepto que induce a la re¬ 
flexion acerca de los componentes de confia- 
bilidad y error en la medicidn (Tryon, 1957). 
Aquf se analizan los aspectos esencialcs de un 
enfoque de muestreo del dominio conocido 
como teon'a de la capacidad para la gencrali- 
zacion (Cronbach y colaboradores, 1972; Feldt 
y Brennan, 1989; Shavelson y Webb, 1991). 

Segun esta teon'a, cuando los psicdlogos o 
educadores quieren medir una variable, casi 
siempre tienen cn mcnlc un dominio o universo 
de conductas (Cronbach, 1984). Por ejemplo, 
cuando se evalua la velocidad en mecanogra- 
ffa, el dominio o universo relacionado podrfa 
ser la velocidad promedio del individuo exa- 
minado en todo tipo de mecanografiado rcali- 
zado durante un mes en particular. Si se pudiera 
observar y calcular la velocidad mecanogrdfica 
promedio de una persona durante todo un mes, 
entonces podrfa tenerse una puntuacidn cn cse 
universo para dicha persona. Por supuesto, dado 
que la puntuacidn de un universo se refiere por 
lo comun a cnormes mucstras de conducta, desde 
un punto de vista prdctico hay que acomodarse 
a una muestra finita de conducta. Por ejemplo, 
podrfa calcularse la velocidad mecanogrdfica 
en una prueba de mecanografiado —realizada 
por un examinador en particular, para un perio- 
do especffico y cn cierto dfa. A partir de esta 
muestra finita de conducta se espera gencrali- 
zar al universo m£s amplio de posibles rcsulta- 
dos, de aquf el nombre de teorfa de la capacidad 
para la gencralizacidn. 

Aquf son evidentes algunos paralelismos 
con la teorfa cldsica. La muestra finita de con¬ 
ducta en la teorfa de la capacidad para la gene- 
ralizacidn es similar a la puntuacidn observada 
en la teorfa cldsica. Lo que es mds, la puntua¬ 
cidn del universo cn aqublla es igual a la pun¬ 
tuacidn verdadera en la teorfa cldsica. De la 
misma manera en que una muestra puede o no 
ser una represen tacidn precisa del dominio (teo¬ 
rfa de la capacidad para la generalizacidn), una 
puntuacidn obtenida puede o no ser una repre- 
sentacidn precisa de la puntuacidn verdadera 
(teorfa cldsica). De modo que ambos enfoques 
tienen cicrtos componentes en comun. 


La diferencia es que la teorfa de la capa. 
cidad para la generalizacidn reconoce que 
pueden existir varios universos altemativos y 
viables de gene rail zacion. cada uno de los cua- 
les contiene fuentes caractcrfsticas de error de 
medicidn. Para reconocer la existencia de uni¬ 
versos altemativos de generalizacidn, Cronbach 
y colaboradores (1972) introducen el concepto 
de facetas. Solas oen combinacidn, las facetas 
definen universos: 

Clasiiicamos las condiciones de observacibn con 
respecto a facetas; por ejemplo, formas de prue¬ 
ba, observadores y ocasiones. Esto alina la deli- 
nicibn del universo de generalizacidn y resalta la 
importancia de la definicibn del universo. Con fre- 
cuencia, los investlgadores ellgen procedimlen- 
los para evaluar la confiabilidad que delinen de 
manera implfcita un universo mbs estrecho de lo 
que requiere su leoria de sustentacibn. Cuando 
hacen esto, subestiman el 'error" do mediclbn, 
es declr, el error de generalizacibn. 

Por ejemplo, en un caso podrfa desearse cono- 
cer la manera en que una persona responde a 
una prueba de mecanografiado cuando sc le 
confronta con un supervisor cstricto. En esia 
situacidn, utilizar a un supervisor estricto para 
conducir la prueba de mecanografiado no in¬ 
troduce un error de medicidn. En otro caso, 
podrfa tenerse la intcncidn de conocer la mane¬ 
ra en que la persona examinada responde a una 
prueba de mecanografiado cn un medio de ofi- 
cina mds tfpico. Para esta circunstancia, utili¬ 
zar a un examinador estricto introducirfa una 
fuente no deseada de error de medicidn. El ele- 
mento esencial de la teorfa de la capacidad para 
la generalizacidn es que no se pueden especifi- 
car las fuentes de error de medicidn hasta que 
sc defina cl universo relacionado de generali¬ 
zacidn. 

Cronbach (1970) expresa cl concepto cen¬ 
tral de esta teorfa en la siguiente seleccidn: 

Cuando utilizamos una sola observacibn como si 
representara al universo, es tamos generalizart- 
do. Genoralizamos acerca de los callficadores. 
de las selecciones a mecanografiar, quizbs acer¬ 
ca de los dias. Si las puntuaciones observadas a 
partir de un procedimlento concuerdan de mane¬ 
ra estrecha con la puntuacibn del universo, po- 
demos declr que la observacibn es “precisa", 



-oonliatte” o "generalizable’. Y dado qua, entoo- 
cos, las observaciones tambten colnciden entro 
si, declmos quo son "conslstentes” y Henan poca 
varianza de error". Poseer tantos termirvos cau¬ 
sa conlusfcSn, pero no do manera tan grave. B 
rtrmmo qua so utiliza con mis trecueocia en la 
literature es "confiabllidad". El autor preliere 
•generabilldad", porque ose tormrrvo Implies de 
inmedlalo Ygeneralizacibn a qu6?“... Exlste un 
grado dilerente de generabilldad para cada uni- 
verso. Los viejos mitodos de anillsls no dlferen- 
cian las luentes de variacidn. Tratan con una sola 
tuente de varianza o enredan dos o mis fuentes. 

La tcori'a cldsica dc la medic idn aun es el mo- 
delo dominante en psicometrfa. Sin embargo, 
la teoria de la capacidad para la generalizacidn 
ha satisfecho una funcidn valiosa al rccordarlc 
a los examinadores que la confiabilidad no es 
una cualidad estlitica que reside dentro de la 
prueba en si; mis bien, la confiabilidad es una 
propiedad que surge de la prueba en conjunto 
con las circunstancias de uso. En particular, la 
confiabilidad siempre dependc de la manera en 
que se define al universo de conductas poten¬ 
tiates, al universo de general izacidn. 


I CIRCUNSTANCIAS ESPEC1ALES 

EN LA ESTIMACI6N 

DE LA CONFIABILIDAD _ 

Los enfoques tradicionales para la cstimacidn 
de la confiabilidad pueden ser engafiosos o 
mapropiados para algunas aplicaciones. Algu- 
nas dc las situaciones mis problcmiticas im- 
plican caracterfsticas inestablcs, pruebas de 
velocidad, rcstriccion del rango y pruebas refe- 
ridas a criterio. 


CARACTERIST1CAS INESTABLES 

Se suponc que algunas caracterfsticas tienen 
cambios constantes en reaccidn ante variables 
situacionales o fisioldgicas. Un buen ejemplo 
es la reactividad emocional, cuando se mide a 
travis de la respuesta electroddrmicn o galvi- 
nica dc la piel. Una medida de cste tipo fluctua 
con rapidez en reaccidn ante ruidos fuertes, pro- 
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cesos subyacentcs de pensamiento y aconte- 
cimiento ambientalcs estresantes. Incluso el he- 
cho de hablar con otra persona puede despertar 
una respuesta clcctroddrmica intensa. Debido a 
que la verdadera cantidad de reactividad emo¬ 
cional cambia con tal rapidez, la prueba y la 
repeticidn dc la misma deben ser casi instanti- 
neas a Fin de proporcionar un fndice preciso de 
la confiabilidad para caracterfsticas inestables 
como la medicidn electrodirmica de la reacti¬ 
vidad emocional. 

PRUEBAS DE VELOCIDAD Y DE PODER 

Por lo comun, una prueba de velocidad con- 
tienc reactivos de nivel uniforme y generalmen- 
te simple de dificultad. Si cl tiempo lo permite, 
la mayona dc los individuos deberin ser capaces 
de terminar con la mayor parte o con todos los 
reactivos de una prueba dc este tipo. Sin embar¬ 
go, como el nombre lo sugierc, una prueba de 
velocidad tiene un Ifmite restriclivo de tiempo 
que garanliza que pocas personas lerminen la 
prueba completa. Dado que los reactivos inten- 
tados tienden a ser corrcctos, la puntuacidn de 
una persona en una prueba dc velocidad rcfleja 
en gran medida la velocidad del dcsempeno. 

Con frecuencia, las pruebas de velocidad 
se conlrastan con las pruebas de podcr. Una 
prueba dc poder concede el tiempo suficicnte 
para que quicncs realizan la prueba hagan el 
intento de responder a todos los reactivos, pero 
se construye de tal manera que no todas las per¬ 
sonas puedan obtener una puntuacidn perfecta. 
Casi todas las pruebas contienen una mezcla 
de componentes de velocidad y de poder. 

El elemento mils importante a destacar acer- 
ca de la confiabilidad de las pruebas de veloci¬ 
dad es que el enfoque tradicional de divisidn 
por mitadcs (comparacidn de reactivos nones y 
pares) producirfi un coeficicntc de confiabilidad 
engahosamente alto. Considdresc a un exami- 
nando que termina 60 dc los 90 reactivos en 
una prueba dc velocidad. Es mas probable que 
el enfoque de pares-nones muestre 30 reactivos 
nones correctos y 30 reactivos pares correctos. 
Con datos similares de otros sujetos, la corre- 
lacion entre las puntuaciones en los reactivos 
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pares y nones se acercarf necesariamcnte a 
+1.00. La confiabilidad de una prueba de velo- 
cidad debe basarse en el m&odo test-retest o en 
la confiabilidad por mitades de dos mitadcs de 
prueba cronometradas de manera independien- 
te. En el ultimo caso, se requiere la correccidn 
de Spearman-Brown. 

restricci6n Da rango 

La confiabilidad test-retest serf enganosamen- 
le baja si se basa en una muestra de pacientes 
homog6neos. para los cuales existc una restric- 
ci6n del rango en cuanto a las caracterfsticas 
medidas. Por ejemplo, scria inapropiado estimar 
la confiabilidad de una prueba de intcligencia 
al aplicarla dos veces a una muestra de estu- 
diantes universitarios. Este punto se ilustra con 
el diagrama de dispersidn hipotdtico, pero rea- 
lista, que se muestra en la figura 3-13, dondc 
cl lector puede ver una fucrte correlacidn test- 
retest para el rango completo de sujetos di ver¬ 
sos, pero una correlaci6n ddbil para los sujetos 
mSs inteligentes vistos de manera aislada. 

CONFIABILIDAD DE LAS PRUEBAS 
REFERIDAS A CRITERIO 

El lector recordarf quc en el primer tema de 
este capftulo se habld de que las pruebas referi- 



Segunda punluoc!6n de prueba 


Figura 3-13. 0 muestreo da un rango restringido de 
Individoos causa que la confiabilidad test-retest soa 
engaftosamente baja. 


das a criterio evaluan el desempeno en t6rmi- 
nos de dominio en vez de evaluar un continuo 
de rendimiento. Los rcactivos de prueba se di- 
seftan para idenlificar habilidades cspccfficas 
que necesitan rcgularizacidn; por tanto, los 
rcactivos tienden a ser de la variedad “aproba- 
do-reprobado”. 

La estructura de estas pruebas es de tal lipo, 
que la variabilidad de las puntuaciones entre 
los examinandos es, por lo comun, bastante pc- 
quena. Dc hccho, si los rcsultados de prueba se 
utilizan con propdsitos de entrcnamienlo y los 
individuos continuan en entrenamiento hasta 
quc dominan todas las habilidades requeridas 
en la prueba, la variabilidad en las puntuacio¬ 
nes se vuelve nula. Bajo tales condicioncs, los 
enfoques tradicionales para la evaluacidn de la 
confiabilidad son simplemente inapropiados. 

En el caso de muchas de las pruebas refe- 
ridas a criterio. los rcsultados deben ser casi 
absolutamente prccisos para que sean utiles. Por 
ejemplo, cualquicr error dc clasificacidn es gra¬ 
ve si el propdsito dc la prueba consiste en dc- 
terminar la capacidad de un individuo para 
manejar un automdvil con transmisidn manual 
o “palanca de velocidadcs”. El aspecto clave 
en este caso no es si las puntuaciones de lest- 
retest son cercanas entre sf sino, m6s bien, si la 
clasificacidn (“puede hacerlo/no puede hacer- 
lo") es la misma en ambos casos. Lo que en 
realidad se quicre saber es cl porccntaje de per¬ 
sonas con las cuales se llega a la misma deci- 
si6n en ambas ocasiones —entre mis cercano 
sea a 100%, mejor. £ste es s61o un ejemplo de 
la necesidad de rfcnicas especializadas en la 
evaluacidn de pruebas no normativas. Berk 
(1984) y Feldt y Brennan (1989) proporcionan 
enfoques adicionales para obtencr la confia¬ 
bilidad dc las pruebas referidas a criterio. 


I interpretaci6n de los 

COERCIENTES DE CONFIABILIDAD 

Para este momento, el lector debe ser un ex* 
perto en los diferentes enfoques acerca dc la 
confiabilidad y debe poseer al menos una idea 
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conceptual de c6mo se calculan los coeficien- 
les de confiabilidad. Ademis, se han analizado 
las condiciones espcciales de prueba que dic- 
tan el uso de un tipo de mdtodo de confiabilidad 
en oposicidn a otro. Sin duda, el lector ha nota- 
do quc aun queda por discutir una pregunta 
crucial: £cudl es un nivcl accptablc de confiabi- 
lidad? 

Muchos autorcs sugieren quc la confiabi¬ 
lidad debe ser cuando mcnos de .90 para tomar 
decisiones sobre individuos (p. ej., Salvia e 
Ysseldyke, 1988; Nunnallyy Bernstein. 1994). 
Sin embargo, en real idad no existe una respuesta 
definitiva para esta pregunta. Se ofreccn las 
pautas indefinidas que sugieren Guilford y 
Fruchter (1978): 

Existe derto consenso de que para que una me- 
dkta de las dlterendas Individuales en alguna 
caracterlslica sea muy precise, la confiabilidad 
debe superar al .90. Sin embargo, la verdad es 
que muchas pruebas estindar con confiabilida- 
des tan bajas como .70 resultan ser muy titles. 

Y pruebas con confiabllldades monores que eso 
pueden ser utiles en investigacion. 

En un nivel mils pnktico, las normas acepta- 
blcs de confiabilidad se basan en la cantidad de 
error de medicidn que el usuario puede tolerar 
en la aplicacidn sugerida para una prueba. Por 
fortuna, la confiabilidad y el error de medici6n 
son conccptos interdependientes. Por tanto, si 
el usuario de la prueba puede espccificar un 
nivel aceptablc de error de medicidn, entonces 
tambidn es posiblc determinar las normas mf- 
nimas de confiabilidad que se requieren para 
esa aplicacidn cspecffica de una prueba. Mds 
adelantc se continua con este tema, cuando se 
presenta un nuevo concepto: el error estdndar 
de medicidn. 


I CONFIABILIDAD Y ERROR 
MESTAnDAR DE MEDIQ6N _ 

Para introducir el concepto de error estdndar 
de medicidn, sc comenzard con un experimen- 
to imaginario. Supdngase que se pueden apli- 
ca r miles de pruebas equivalentes de Cl a un 


individuo, y adn mds, que cada sesidn de prue¬ 
ba fuera una expcriencia fresca y novedosa para 
un individuo cooperativo; en este experimento 
hipotdtico, la prdctica y el aburrimiento no ten- 
drfan cfecto sobre las posteriores calificacio- 
nes de prueba. Sin embargo, debido a los tipos 
de errorcs alcatorios que sc analizan en este 
capftulo, las puntuacioncs del desventurado 
paciente no serfan iddnticas entre sesiones de 
prueba, y podrfa tener puntuaciones un poco 
inferiorcs en una prueba debido a que cstuvo 
despierto la noche anterior; la puntuacidn en 
otra prueba podrfa ser mejor debido a que los 
reactivos fueron peculiarmente fdcilcs para 61. 
Aunque dichos factores de error son aleatorios 
e imposiblcs de predecir, de la teorfa cldsica de 
la medicidn se desprende que las puntuaciones 
obtenidas caerdn dentro de una distribucidn 
normal con una media y desviacidn cstandar 
precisas. Digamos que la media de las puntua¬ 
ciones hipotdticas de Cl para el individuo re- 
sultd ser de 110, con una desviacidn estdndar 
de 2.5. 

De hccho, la media de esta distribucidn de 
puntuaciones hipotdticas serfa la puntuacidn 
verdadera estimada del individuo. El mejor es- 
timado es, entonces, que este individuo tiene 
un Cl verdadero de 110. Lo que es mds, la des- 
viacidn cstandar de la distribucidn de puntua¬ 
ciones obtenidas serfa el error estdndar de 
medicidn ( EEM). Obsdrvese quc mientras la 
puntuacidn verdadera en la prueba tiene la pro- 
babilidad de diferir de una persona a otra, el 
EEM se considers constante, como una propic- 
dad inherente de la prueba. Si sc repite este 
experimento hipotdtico con otra persona, es 
probable quc dificra la puntuacidn verdadera 
estimada, pero cl EEM resultard ser de un valor 
similar.* 

Como su nombre lo indica, el EEM es un 
fndice del error de medicidn que atane a la prueba 
en cuestidn. En el caso hipotdtico donde el EEM 
fuera iguai a cero, no habrfa error de medi- 


* Esto serfa correcto en cl caso dc personas de edad 
similar. El EEM puede diferir dc un grnpo dc edad al 
siguiente —v<asc Wcchsler (1997) para un ejcmplo 
con el WAIS-III. 






112 • Evaluation pslcologlca: Hlstoria, prindplos y apllcationes 


(Capilulo 3) 


ci6n en absoluto. Entonces, la puntuaci6n ob- 
tenida por el sujcto tambi6n serfa su puntua- 
cidn verdadera. Sin embargo, este resultado es 
simplemente imposible en una prueba realiza- 
da en la vida real. Toda prueba exhibe cierto 
grado de error de medicidn. Entre mis grande 
sea el EEM, mayor seri el error tfpico de mcdi- 
cidn. Sin embargo, la precisidn o imprecisi6n 
de cualquier puntuaci6n individual es siempre 
una cueslidn probabilfstica y nunca una canti- 
dad conocida. 

Como se seftald, el EEM pucde conside¬ 
rate como la desviacidn cstindar de las pun- 
tuaciones obtenidas por un individuo hipotdlico 
en un gran niimero de pruebas equivalcntes, 
bajo la suposicidn de que se han descartado los 
efectos de la prictica y del aburrimiento. Como 
cualquier desviacidn estindar de una distribu- 
cidn normal, el EEM tiene usos estadfsticos bicn 
conocidos. Por cjcmplo, 68% de las puntuacio- 
nes obtenidas caerd dcnlro de un EEM a partir 
de la media, al igual que 68% de los casos en 
una curva normal caen en una DE de la media. 

El lector rccordari que en este capftulo ya 
se dijo que cerca de 95% de los casos en una 
dislribucidn normal caen dentro de dos DE de 
la media. Por esta razdn, si el examinando rea- 
lizara otra prueba mis de Cl, sc pronosticari'a 
con 95% de probabilidad de estar en lo correc- 
to, que la puntuacidn obtenida se encontrarfa 
dentro de dos EEM del verdadero Cl estimado 
de 110. Sabicndo que el EEM es de 2.5, se pro- 
nosticarfa, por tanto, que la puntuacidn obteni¬ 
da de Cl serfa de 110 ± 5. es decir, serfa muy 
probable (95% de probabilidad) que la puntua- 
ci6n se cncontrara entre 105 y 115. 

Por desgracia, en el mundo real no se tiene 
acceso a las puntuacioncs verdaderas y casi con 
toda seguridad no se pueden obtener multiples 
Cl de grandes numeros de pruebas equivalcn¬ 
tes, como tampoco, por la misma razdn, se pue- 
de tener un conocimiento directo del EEM. Por 
lo comun. todo lo que se posee es un coeficien- 
te de confiabilidad (p. cj., una correlacidn test- 
retext proveniente de estudios normativos) mis 
una puntuacidn obtenida en la aplicacidn de una 
sola prueba. ^C6mo pucde utilizarse esta infor- 
macidn para determinar la probable precision 
de la puntuacidn obtenida? 


cAlculo del error estAndar 

DE MEDICI6N 

Se ha seftalado en varias ocasioncs dentro del 
capftulo que la confiabilidad y el error de me- 
dicidn son conceptos interrclacionados, donde 
la baja confiabilidad implica un alto error dc 
medicidn y viceversa. Por tanto, no deberfa sor- 
prender al lector que el EEM se pueda calcular 
de manera indirecta a partir del coeficientc de 
confiabilidad. La fdrmula es: 


EEM a DE V 1 - r 

donde DE es la desviacidn estindar de las pun¬ 
tuacioncs de prueba y r es el coeficientc de 
confiabilidad, ambos obtenidos dc una muestra 
normativa u otro grupo grande y representati¬ 
ve de personas. 

Se pucde utilizar el Cl Total del WAIS-R 
para ilustrarel cilculo del EEM. Se sabc que la 
DE del WAIS-R es aproximadamente de 15 
unidades y cl coeficiente de correlacidn es de 
.97 (Wcchsler, 1981). Por tanto, el EEM para 
el Cl Total es: 


EEM a 15 V 1 - .97 

que resulta ser aproximadamente de 2.5. 

EEM Y PUNTUACIONES INDIVIDUALS 
DE PRUEBA 

Considdrese con cuidado qud dice el EEM acer- 
ca de los rcsultados individuals de prueba, uti- 
lizando dc nuevo los Cl del WAIS-R para ilustrar 
un concepto general. Lo que en realidad se quie- 
rc saber es la probable exactitud del Cl. Si se 
tiene un individuo que obtiene una puntuacion 
de 90 y la prueba se aplic6 de manera compe- 
tente, £es probable que la puntuacidn de Cl ob¬ 
tenida sea exacta? 

A fin dc responder a esta pregunta, sc ne- 
cesita refrasearla. En la terminologfa de la teo- 
rfa clasica de las pruebas, las preguntas sobre 
precisi6n en realidad implican comparaciones 
entre puntuaciones obtenidas y puntuaciones 
verdaderas. De manera especffica, cuando se 
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cuestiona si una puntuaci6n de Cl es precisa, 
cn rcalidad sc est3 prcgunlando: ^qud tan cer- 
cana esta la puntuacidn obtenida de la puntua- 
cidn verdadcra? 

La respuesta a esta pregunta pucdc consi- 
dcrarsc pcrturbadora a primera vista. Resulta 
$er que. en el caso individual, jnunca se puede 
saber con precisi6n qud tan ccrcana cstd la pun¬ 
tuacidn obtenida de la puntuacidn vcrdadera! 
A lo mds que sc puede llegar es a ofineccr una 
afirmacidn probabilfstica basada en el conoci- 
miento de que las puntuacioncs hipoteticas ob- 
tenidas para una sola persona examinada se 
distribuyen en forma normal con una desviacidn 
estdndar igual al EEM. Con base en esta premi- 
sa, sc sabc que la puntuacidn obtenida es acer- 
tada dentro de un rango de mds o mcnos 2 EEM, 
en 95% de los casos. En otras palabras, se pucdc 
tener una seguridad de 95% de que el Cl Total 
es prcciso dentro de ± 5 puntos de Cl. Este ran¬ 
go de mds o menos cinco puntos de Cl corres- 
ponde al intervalo de confianza de 95% para 
cl Cl Total del WAIS-R, debido a que se tiene 
una confianza de 95% de que la puntuacidn vcr¬ 
dadera se encuentre dentro de dicho intervalo. 

Los examinadorcs harfan bien en presentar 
las puntuacioncs de prueba cn tdrminos de un 
intervalo de confianza, porque esta prdctica 
ayudarfa a colocar a las puntuaciones en la pers- 
pectiva adecuada (Sattler, 1988). Un examinan- 
do que obtienc un Cl de 90 deberfa dcscribirse 
como sigue: “Mr. Doe obtuvo un Cl Total de 
90 puntos, que es preciso en ± 5 puntos, con 
una confianza de 95%’’. Esta redaccidn ayuda 
a advertirlc a otras personas que las puntuacio¬ 
nes de prueba siempre incorporan cierto grado 
de error de mcdicidn. 

KM Y DIFERENCIAS 

entre puntuaciones 

Con frecuencia sc espera que los examinado- 
res informcn si una persona ha obtenido pun¬ 
tuaciones significativamente mds alias en un 
drea de capacidad que cn otra. Por ejemplo, en 
general es pertinente informar si una persona 
tiene mayor fortaleza en tareas verbales o de 


ejecucidn o deeir que no existen diferencias 
realcs cut re estas dos areas de habilidad. El pro- 
blema no es totalmcntc acaddmico. Un indivi- 
duo que tiene una relativa superioridad en 
inteligencia de ejecucidn podrfa recibir orienta- 
ci6n para seguir una carrera prdctica. En contras- 
te, una fortaleza en inteligencia verbal podrfa 
resultar en una recomendacidn para perseguir 
intereses acaddmicos. ^C6mo puede determi- 
nar un examinador si una puntuacidn de prue¬ 
ba es significativamente mejor que otra? 

Debe tenerse cn mente que toda puntua- 
ci<5n de prueba incorpora un error de medicidn. 
Por tanto, es posible que una persona obtuvie- 
ra una puntuacidn verbal mds alia que aqudlla 
en ejecucidn cuando las puntuaciones verda- 
deras subyacentes —si tan sdlo pudidramos 
conocerlas— no revelarfan difcrencia jo incluso 
demostrarfan el patrdn contrario! (figura 3-14). 
La leccidn importante en este caso es que cuan¬ 
do cada una de las dos puntuaciones obtenidas 
refleja error de medicidn, la diferencia entre 
estas puntuacioncs es bastantc voldlil y no debe 
sobreinterpretarse. 



obtonlda 

‘Note: en este caso hipotttico, el Cl Verbal obtenido es mayor 
que el Cl de Ejecucidn obtenido. mientras que las puntuaciones 
verdaderas subyacentes muestran el palrdn contrario 

Figura 3-14. Las puntuaciones obtenidas reflejan el 
error de medicidn y, por tanto, pueden oscurecer la re- 
lacidn entre las puntuaciones verdaderas. 
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El error est&ndar de la diferencia entre 
ambas puntuaciones es una medida estadfslica 
que puede ayudar al usuario de la prueba a de- 
terminar si es significativa una diferencia entre 
puntuaciones. El error estdndar de la diferen¬ 
cia entre dos puntuaciones puede calcularsc a 
partir de los EEM de las pruebas individuates 
mediante la siguiente fdrmula: 

= V (KM,) 2 + 

donde EEm es el error estfindar de la diferencia 
y EEM\ y EEMz son los errores estdndar de 
medicidn rcspectivos. 

Sc supone que las dos puntuaciones sc en- 
cucntran cn la misma escala o se han converti- 
do a ella. Es decir, las pruebas deben tener la 
misma media y desviacidn estdndar gencralcs 
en la muestra normativa. Al sustituir DE 

yjl -r„ para el EEM, y DE - r„ para 
EEM,, llegamos a: 

EE m = DE 7 2 - r„ - r M 

Regresamos a nuestra pregunta original para 
ilustrar cl cftlculo y uso del EEa,i. £C6mo pue¬ 
de determinar un examinador que una puntua- 
ci6n de prueba es significativamente mejor que 
la otra? En particular, supdngase que una per¬ 
sona obtiene un Cl Verbal de 112 y un Cl de 

Hresumen 

1. En las pruebas psicoldgicas, la confiabilidad 
se refiere al atributo de consistencia de la 
medic i6n. Pocas medidas conductuales son 
totalmcntc confiables —casi en todos los 
casos cst5 presente cierto grado de incon- 
sistencia de una medicidn a la siguiente. La 
confiabilidad deberfa considerarse como un 
continuo. 

2. Scgun la teorfa clasica de las puntuaciones 
verdadcras y de error, cualquier puntuacidn 
de prueba reflcja la influcncia de dos facto- 
res: aqucllos que contribuyen a la consis¬ 
tencia, es decir, los alributos estables que 
cl examinador pretende medir; y aqucllos 
que contribuyen a la inconsislencia, que 


Ejecucidn de 105 cn el WAIS-R. ^Siele puntos 
de Cl rcprescntan una diferencia significativa? 

Se sabe. con base cn cl manual del WAIS-R 
(Wcchslcr, 1981), que los Cl Verbal y de Eje¬ 
cucidn tienen cada uno desviaciones estandar 
de aproximadamente 15 y que sus confiabilidades 
respectivas son .97 y .93. El error estindar dc 
la diferencia entre estas dos puntuaciones pue¬ 
de encontrarsc a partir de: 

EE in B 15 ^2 - .97 - .93 = 4.74 

Rccudrdese de la discusidn acerca de las distri- 
buciones normales que 5% de los casos ocurren 
en los extremos, mds alld de ± 1.96 desviacio¬ 
nes estdndar. Asl, las diferencias que son 
aproximadamente del doblc del EE t , r (es decir, 
1.96 X 4.74) pueden considerarse significati- 
vas en el sentido de que ocurrirdn por azar sdlo 
en 5% dc las ocasiones. Por tanto, podrfa con- 
cluirsc que es probable que las diferencias dc 
aproximadamente nueve puntos o mfis entre los 
Cl Verbal y dc Ejecucidn reflejen diferencias 
reales cn puntuaciones m&s que contribuciones 
aleatorias de los errores de medicidn. Asf, cs 
m^s probable que una diferencia de tan sdlo 
siete puntos dc Cl no represente una diferencia 
significativa, autdntico, entre la intcligcncia 
verbal y de ejecucidn. 


incluyen las variables del sujeto, la prueba 
y la situacidn. 

3. La ecuacidn fundamental de la teorfa cldsi- 
ca de la medicidn es 

X= V* e 

donde X es la puntuacidn obtenida, V es la 
puntuacidn verdadcra y e reprcscnla los 
errores de medicidn. 

4. Los errores de medicidn pueden surgir du¬ 
rante la seleccidn dc los reactivos, la apli- 
cacidn de la prueba y la calificacidn de la 
misma. Los errores sistemdticos tambi6n 
pueden contribuir al error de medicidn. Un 
ejemplo de error de medicidn producido pof 
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|a seleccidn dc reactivos es que en este pro- 
ccso de seleccidn. el autor dc la prueba puc- 
de clegir reactivos que no son igualmcnte 
justos para todas las personas. 

5. Los errores sistcmuticos pueden surgir cuan- 
do, sin que el autor lo sepa, una prueba midc 
alguna otra cosa adcmds del rasgo que se 
pretende medir. Por cjemplo, una prueba 
para medir la intro versidn social puede eva- 
luar la ansiedad de mancra consistente e 
inadvertida. 

6. Las suposiciones basicas de la teorfa cldsi- 
ca de la mcdicidn son: 1) los errores de me- 
dicidn son aleatorios, 2) la media del error 
de medicidn es igual a cero, 3) las puntua- 
cioncs verdaderas y las puntuacioncs de 
error no tienen corrclacidn y, 4) los errores 
en diferentes pruebas no tienen correlacidn. 
De estas suposiciones se deduce que la 
varianza de las puntuaciones obtenidas es 
simplcmente la varianza de las puntuacio¬ 
nes verdaderas mds la varianza dc los erro¬ 
res dc medicidn. 

7. La conflabilidad expresa la influcncia rcla- 
tiva de las puntuacioncs verdaderas y de 
error sobre las puntuacioncs obtenidas en 
la prueba. El coeficientc dc conflabilidad 
es la proporcidn dc la varianza de las pun¬ 
tuacioncs verdaderas con respecto a la va¬ 
rianza total de las puntuaciones de prueba 
(varianza dc las puntuaciones verdaderas 
mds varianza de las puntuaciones dc error). 
El valor del coeficientc dc confiabilidad 
puede variar entre 0 y 1.0. 

8. El coeficientc de correlacidn producto-mo- 
mento de Pearson puede utilizarse para es- 
timar la consistencia dc las puntuaciones 
de una prueba psicoldgica. Esta forma dc 
confiabilidad se conoce como conflabilidad 
test-retest. La confiabilidad de formas al- 
temas se calcula a travds de correlacionar 
las puntuaciones en dos formas cquivalen- 
tes, aplicadas en forma contrabalanceada a 
un amplio grupo de sujetos hetcrogdncos. 

9. Los enfoques de confiabilidad relacionados 
con la consistencia interna incluyen la 
confiabilidad por mitades, en la cual se 
correlacionan entre sf las puntuaciones de 


ambas mitades de una prueba, y cl coefi- 
ciente alfa (a), que puede considerarse 
como la media dc todas los posiblcs coefi- 
cientes por mitades. 

10. Para las pruebas que requicrcn del juicio 
del examinador para la asignaci6n de 
puntuacioncs, es ncccsaria la confiabilidad 
intercalificadores. El cdlculo de la confiabi¬ 
lidad intcrcalificadores es scncillo: dos o 
miis examinadores califican de mancra in- 
dependiente una muestra de pruebas y des¬ 
puds se correlacionan las puntuacioncs por 
pares de examinadores. 

11. La teorfa de la capacidad para la generaliza- 
cidn, un modelo dc medicidn relacionado 
con el mucstreo del dominio, constituye un 
punto de vista altemativo para la compren- 
sidn de la confiabilidad. Segun este modelo 
puede espccificarse un universo rclaciona- 
do de conductas, llamado dominio, para 
cualquier (area de medicidn. Una prueba 
constituye una muestra de conducts que 
puede o no ser representativa del dominio. 

12. Los enfoques tradicionales para la estima- 
cidn de la confiabilidad pueden ser enga- 
fiosos o inapropiados para las siguientes 
aplicaciones: cuando la caracterfstica me- 
dida es sumamentc voldtil o inestable; en el 
caso dc pruebas dc vclocidad que tienen 
reactivos de dificultad mcnor; y cuando los 
sujetos son sumamente homogdneos en 
cuanto a la caracterfstica medida. 

13. En cl caso de las pruebas rcferidas a critc- 
rio, los resultados deben ser casi perfecta- 
mente confiables como para considerarlos 
Utiles. Dado que, con frecucncia estas prue¬ 
bas tienen una cualidad dc "puede haccrlo/ 
no puede haccrlo”, la repetibilidad de la cla- 
sificacidn es un mdtodo para evaluar su 
confiabilidad. 

14. La confiabilidad se relaciona de manera 
inversa con el error estUndar de medicidn 
(EEM ), cl cual determina el intervalo de 
confianza que rodca a la puntuacidn dc todo 
examinando. Por cjemplo, el intervalo dc 
confianza de 95% se encuentra a ± 2 EEM 
de la puntuacidn obtenida pore) individuo. 
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M TCRMINOS Y CONCSPTOS CLAVE 


Confiabilidad p. 94 

Tcorfa cl4sica de medicidn p. 94 

Puntuacidn verdadera p. 94 

Errores dc medic i6n p. 94 

Error no sistemdtico de medici6n p. 97 

Coeficieniede confiabilidad p. 99 

Coeficiente dc corrclacidn p. 100 

Confiabilidad test-retest p. 101-102 

Confiabilidad de formas alternas p. 102 

Confiabilidad por mitades p. 103 

Fdrmula Spearman-Brown p. 104 


Cocficiente alfa (a) 

p. 105 

Fdrmula Kuder-Richardson 20 

p. 106 

Confiabilidad intcrcalificadores 

p. 106 

Teorfa dc la capacidad para 
la gcncralizacidn 

p. 108 

Prueba de velocidad 

p. 109 

Prueba de poder 

p. 109-110 

Resiriccidn del rango 

p. 110 

Error estdndar de medicidn 

p. Ill 

Intervalo de confianza 

p. 113 

Error est£ndar dc la diferencia 

p. 114 ■ 
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wmo sabe casi cualquier estudiante de 
psicologfa, el mdrito de una prueba psicolOgica 
scdetermina, en primer lugar, porsu confiabili- 
dad, pero en ultima instancia por su validez. En 
el capitulo anterior sc sciiald que la confiabili- 
dad pucde estimarse a travds dc muchos md- 
todos, en apariencia diferentes, que van desde 
el cnfoque conceptualmente directo del test- 
west hasta las metodologfas tcOricamente mds 
complejas de la consistencia interna. Sin em¬ 
bargo. sin importer el mdtodo que sc utilicc, la 


evaluation de la confiabilidad sc reduce dc modo 
invariable a una simple estadistica de resumen. 
el coeficiente de confiabilidad. En este capftu- 
lo se investiga el aspecto mSs diffcil y complejo 
de la validez —el significado de una punluaciOn 
dc prueba. El conccpto de validez todavfa se 
encuentra en evolucidn y, por tanto, provoca 
una cantidad mucho mayor de controversias 
que su humilde y formal pariente, la confiabilidad 
(AERA. APA y NCE. 1999). En cl tema 4A. 
Conceptos basicos de validez, se presentan los 


117 






118 • Evaluation psicologlca: Hlsloria, prlncipios y aplicationes 


(Capitulo 4) 


conceptos esenciales acerca de la validez, m- 
cluyendo la divisi6n tripartita esl^ndar en vali¬ 
dez dc contenido. relacionada con el criterio y 
dc constructo. Tambi6n sc analizan las cuestio- 
nes extemas a la validez, que incluycn los efee- 
tos colatcrales y consecuencias involuntarias 
dc la aplicacidn dc pruebas. Estas cuestiones 
ban fomentado una dcfinicion mis amplia dc la 
validez de prueba que se extiende mis all;! de 
los conccptos tdcnicos dc contenido, critcrios 
y constructos. En el tema 4B, Construccidn dc 
pruebas, se destaca que la validez debe formar 
parte integral de la prueba desde el principio, 
m.1s que limitarsc a las etapas Finales del desa- 
rrollo dc prueba. 

Dicho en uSrminos sencillos, la validez 
de una prueba es el grado en que mide aqucllo 
que afirma medir. Durante mucho tiempo, los 
psicdmclras han reconocido que la validez es 
la caracterfstica mtis fundamental e importante 
de una prueba. Dcspuds de todo, estc tdrmino 
define el significado de las puntuaciones de 
prueba. La confiabilidad es importante tambidn, 
pero sdlo hasta cl punto dondc restrinja la vali¬ 
dez. En la medida en que una prueba sea poco 
confiable, no puedc ser vlida. Esto puede ex- 
presarsc desde una perspectiva altcrna: la 
confiabilidad es precursor necesario, pero no 
suficiente, de la validez. 

Los autorcs dc pruebas tienen la responsa- 
bilidad dc demostrar que los nuevos instrumcn- 
tos satisfacen los propdsitos para los cuales se 
disenaron. Sin embargo, a difcrcncia de la con¬ 
fiabilidad de prueba, la validez no es una cues- 
tidn simple que se resuel vc con facilidad a travds 
dc unos cuantos estudios rudimentarios. La vali- 
dacidn es un proceso en cvolucidn, que comien- 
za con la construccidn de prueba y continua de 
manera indefinida: 

Dospuos de que se pone en operadcWi una prue- 
ba, puede continuarse afinando, rofinando y en- 
riqueciendo ei significado Interpretative de sus 
puntuaciones a trav6s de la acumulacibn gra¬ 
dual de observaciones dfnicas y de proyectos 
especiales de investigacidn... La validez de 
prueba es algo vivlente; no muere y se le embal- 
sama en el momento en que se publica la prue¬ 
ba (Anastasi, 1986). 


La validez dc una prueba dependc dc la acu- 
mulacidn de descubrimicntos de investigacidn 
(ejemplo dc caso 4-1). En las siguientes scc- 
ciones se exarainan los tipos de evidencia que 
se buscan en la validacidn de una prueba psico- 
ldgica. 

■tvIvAUDEZ: DEFINICldN 

Se comienza con una definicidn de validez, 
parafraseada del influyente Standards for Edu¬ 
cational and Psychological Testing (AERA, 
APAyNCME, 1985, 1999): 

Una prueba es vAllda at grado en que las 
inferencias que se realicen a partir de ella sean 
apropiadas, significativas y utiles. 

V6ase que una puntuacidn de prueba por.sf 
misma carece dc significado hasta que el exa- 
minador extrac inferencias de ella con base en 
el manual de prueba o en otras conclusioncs dc 
la investigacidn. Por ejemplo, el conocimicnto 
de que una persona evaluada ha obtenido una 
puntuacidn un tanto clevada en la eseala dc 
Depresidn del MMPI-2 no es de ulilidad par¬ 
ticular. Estc rcsultado sdlo se vuelve valiosoen 
el momento en que cl examinador infierc ca- 
raclerfsticas conductualcs a partir de 61. Con 
base en la investigacidn existente, el examina¬ 
dor podria concluir que “la puntuacidn clevada 
en Depresidn sugicre que la persona examina- 
da tiene poca energfa y una actitud pesimista 
ante la vida”. La eseala de Depresidn del MMPI-2 
posec validez psicomdlrica en la medida en que 
tales inferencias sean apropiadas, significativas 
y utiles. 

Por desgracia, en pocas ocasiones es posi- 
ble resumir la validez dc una prueba en tdrmi- 
nos de una cstadfstica unica y prccisa. La 
determinacidn dc la idoneidad, significado y 
utilidad de las inferencias, rcquierc por lo co- 
mun de numerosos estudios acerca de las rela- 
ciones entre el desempeiio en una prueba y otras 
conductas observadas de manera independicn- 
te. La validez reflcja un juicio cn cvolucidn. 
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Ejemplo DE CASO 4-1 

LA INVESTIGACI6N COMO DEMOSTRACl6N ESENCIAL DE LA VALIDEZ DE UNA PRUEBA 

_ i i. _ . 1 . .1. ,.i 1 1 

En colaboracidn con su asesor de la lacullad, un esludiante do posgrado en psicologfa Intentd 
disenar una medida de lipiz y papel acerca de la timidez. £ste siguid los pasos aproplados de 
seleccldn de reactivos y construccidn de escala quo se analizan en la siguiente seccidn (tema 
4B, Construccldn de pruebas) y despuds tratd de validar su Inslrumento correlaclonandolo con 
medldas oxistentes, como las 10 oscalas clfnicas del MMPI. Por desgracia, esta nueva medida, 
que de manera tentative se llamd Indies de llmidoz, resultd tenor una correlacidn muy elevada 
con la escala de Depresidn del MMPI (r= .65) y. on esencia, ninguna correlacldn con la Escala 
de Inlroversibn Social del MMPI (r= .08). La medida de timidez del esludiante de posgrado era, 
en apariencia, un fndice de ineptitud social y de la depresidn resullante. Existe una moraleja 
para esta breve hlstoria: el rasgo medldo por una prueba especlllca se define a travbs de la 
investigation acerca de su validez y no por el nombre que el aulor decide ponorle al Inslrumento. 


basado en la invcstigacidn, acerca de qu6 tan 
adecuadamcnte midc la prueba aquel atributo 
para cl cual se disend. En consecuencia, la 
validez de las pruebas no puede captarse con 
facilidad a travds de rcsumcnes cstadfsticos 
exact os, sino que mis bien se le puede caracte- 
rizar en un continuo que va de ddbll a acepta- 
ble a fucrtc. 

Tradicionalmcntc, las diferentes mancras 
dc acumular evidcncia de la validez se han agru- 
pado en tres categorfas: 

• Validez de contcnido. 

• Validez relacionada con el criterio. 

• Validez dc constructo. 

En breve se profundizari sobre esta perspecti- 
va tripartita de la validez, pero antes deben ex- 
ponersc cicrtas rcservas. El emplco de estas 
ctiquetas convcnicntcs no implies que existan 
tipos precisos dc validez 0 que un proccdimien- 
to cspeci'fico dc validacidn sea mejor para uti- 
lizarse en una prueba y no en otra: 

Una valktacibn ideal incluyo varios tipos de evi- 
dencin, que abarcan las tres categorfas tradiclo- 
sales. SI no Intervienen otros factores, mds 
fuentes de evldencia son mejores que pocas. Sin 
embargo, la calldad de la evidencla es de Impor- 
•anew primordial y una sola Ifnea sblkla es prete- 
nblo a numerosas de calidad cuestionabte. B 


jutek) profeslonal dobo gular las decislones con- 
cemientes a las formas do evidencla que son mds 
necesarias y factiblos en visla de los usos pro- 
puestos para la prueba y de cualesquiera alter- 
nativas probables para la mlsma (AERA, APA y 
NOME. 1985). 

Estos puntos pueden resumirse al dcstacar que 
la validez es un concepto unitario que se deter- 
mina por el grado en que una prueba mide lo 
que pretende medir. Las inferencias que se ex- 
traen de una prueba vdlida son apropiadas, 
significativas y utiles. En este sentido, deberfa 
scr aparente que casi cualquier estudio empfri- 
co que relacione las puntuacioncs de prueba 
con otros datos es una fuente potencial de in- 
formacidn de validez (Anastasi, 1986; Mcssick, 
1995). 

UvAUDEZ DE CONTENIDO 


La validez de contcnido se determina por el 
grado en que las preguntas, (areas 0 reactivos 
de la prueba constituyen una mucstra represen- 
tativa del universo dc conductas para el cual se 
disenaron; en teorfa, no es mis que una cues- 
tidn dc mucstreo (Bausell, 1986). Los reactivos 
dc una prueba pueden considerarse como una 
muestra obtenida de una poblaci6n mis amplia 
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dc reactivos potenciales que definen aquello que 
el investigador realmcnte desea medir. Si la 
muestra (reactivos cspecfficos de la prueba) es 
representati va dc la poblacidn (todos los reacti¬ 
vos posiblcs), entonces la prueba posee validez 
de contenido. 

Dicha validez es un concepto util cuando 
se sabc mucho acerca dc la variable que el in¬ 
vestigador desea medir. En particular en el caso 
de las pruebas de rendimiento, con frecuencia 
es posible espccificar de antemano el universo 
relacionado de conductas. Por ejemplo, cuan¬ 
do se crea una prueba de rendimiento para or- 
tograffa, un investigador puedc idcntificar casi 
todas las palabras posiblcs que los nirtos de ter- 
cer grado deberfan saber. La validez de conte¬ 
nido de esta prueba se garantizarfa, en parte, si 
se tomara una muestra aleatoria de palabras de 
diverso nivel de dificultad, de una lista preexis- 
tente. 

Sin embargo, los autores de pruebas deben 
tener cuidado de especificar tambiln el univer¬ 
so relacionado de respuestas. Con demasiada 
frecuencia se da por sentado cl formato de op- 
cion multiple: 

Si el constructor conserve una mente abierta en 
cuanto a sus fines, con frecuencia decidlra que 
la (area deberia requerir de una respuesta ela- 
borada por el estudiante —respuestas abiertas 
o, si se han de reducir al mfnimo las inhibiciones, 
respuestas orales. Tampoco se han de descui- 
dar las instrucciones que se den al Individuo y el 
entomo social de la prueba cuando se define la 
tarea (Cronbach, 1971). 

Con respecto al rendimiento en ortograffa, no 
puede suponerse que una prueba de opcidn 
multiple medird las mismas habilidadcs en or¬ 
tograffa que una prueba oral o que el cdlculo 
de la frecuencia dc errores ortogr&ficos en una 
composicidn cscrita. Asf, cuando se evalua la 
validez de contenido. la especificacidn de la res¬ 
puesta tambiln es una parte integral de la defi- 
nicidn del universo relacionado de conductas. 

La validez de contenido es mds diffcil de 
garantizar cuando la prueba mide un rasgo de- 
finido dc modo aproximado. ^Qud esperanza 
puede tener un autor de pruebas dc especificar 
el universo de reactivos potenciales para una 


medida de ansiedad? En estos casos, cuando el 
rasgo a medir es menos tangible, ningun autor 
de pruebas en pleno uso de sus facultades in- 
tentariaconstruirel universo literal de reactivos 
potenciales de prueba. En vez de ello, lo que 
por lo general se toma como validez de conte¬ 
nido es la opinidn considerada de jueces ex- 
pertos. En efecto, el autor de pruebas afirma 
que “un panel de expertos revisd de rnanera 
cuidadosa la especificacidn del dominio y juz- 
g6 que las siguientes preguntas dc prueba po- 
scen validez dc contenido". La figura 4-1 
reproduce una muestra de un formato de califi- 
cacidn para jueces que se emplea para determi- 
nar la validez de contenido de las preguntas de 
prueba. 

CUANT1FICACI6N de la validez 
DE CONTENIDO 

Lawshe (1975), Martuza (1977) y otros auto- 
res han analizado los mdtodos cstadfsticos para 
determinar la validez general de contenido de 
una prueba a partir de los juicios de expertos. 
Estos mltodos tienden a ser muy especializa- 
dos y no han obtenido una amplia accptacidn; 
sin embargo, sus enfoques pueden servir como 
un modclo para el punto de vista de sentido 
comun acerca de la concordancia intercalifica- 
dores como base para la validez dc contenido. 

Cuando dos jueces expertos valoran los 
reactivos individuates de una prueba en la cs- 
cala de cuatro puntos que se propone en la fi¬ 
gura 4-1, las calificaciones de cada juez para 
cada rcactivo pueden dividirse en dos tipos: 
relevancia dibit (calificaciones de 1 o 2) con¬ 
tra rclevancia fuerte (calificaciones de 3 o 4). 
Entonces, pueden anotarse las calificaciones 
conjuntas de ambos jueces para cada rcactivo 
en el cuadro de concordancia de das por dos 
que se presenta en la figura 4-2. Por ejemplo, 
si los dos jueces consideraron que un reactivo 
era sumamente relevante (relevancia fuerte), se 
le colocarfa en la casilla D. Si el primer juez 
considerd que un rcactivo era muy relevante 
(rclevancia fuerte) pero el segundo lo conside¬ 
rd sdlo como apenas relevante (relevancia dl- 
bil), el reactivo se colocarfa en la casilla B. 


J 



I 
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fttvtsor _Facta: 


pot tavor tea cuidadosamenle la especiticadOn dot dominlo para esta prueba A continuation, Indique por lavor qua tan Men sterile 
us ted quo cada reactivo relleja la espotificaciOn del dominlo Juzgue a cada uno de manera individual coo base en la comparatiOn 
er.ire su contenido y aquel delinido por la espetilicatiOn del dominlo Por lavor utWce la escala de cuatro puntos que se muestra abajo 

12 3 4 

noralaclonado un tanlo relacionado bastnnto rolaclonado muy roloclonndo 


Flgura 4-1. Muestra de lormato de calificackin de reactivos por parte de Jueces para la determlnacidn de la validez 
de contenido. 

Fuento: Basado en Martuza (1977). Hambleton (1984). Bausell (1986). 


Obs^rvese que la casilla D es la tlnica quc 
reflcja concordancia vdlida entre los jueces; las 
otras, implican dcsacuerdo (casillas B y C) o 
concordancia en que un reactivo no debe estar 
en la prueba (casilla A). En la figura 4-3 sc 
presentan los rcsultados hipotdticos para una 
prueba de 100 reactivos. Cor. la siguiente fdr- 
mula se puede obtener un coeficientc de la va¬ 
lidez de contenido: 

D 

validez de contenido =- 

(4 ♦ 0 ♦ C ♦ O) 

Porejemplo. en la prueba de 100 reactivos. am- 
bos jueces concordaron en que 87 reactivos 
tenfan una fuerte rclevancia (casilla D). de modo 
que el coeficiente de validez de contenido serfa 


JUEZ EXPERTO » 1 

Relation Relation 

dObil luerte 

(reactivo (reactivo 

calllicado calificado 

con 1 o 2) con 3 o 4) 


Relation dObd 
(reactivo calllicado 
JUEZ con 102) 

EXPERTO » 2 

Relation luerte 
(reactivo calllicado 
con 3 o 4) 


Flgura 4-2. Modelo de concordancia Intercalilicadores 
para la validez de contenido. 


87/(4+4+5+87) o .87. Si sc ulilizan mds de dos 
jueces. este procedimiento dc cdlculo podrfa 
llevarse a cabo con todas las pasiblcs combi- 
naciones de pares de jueces c informar el coe- 
ficiente promedio. Una nola importante: un 
coeficiente de validez de contenido es sdlo un tro- 
zo de evidencia en la valoracidn de una prueba. 
Dicho coeficiente no cstablece en si mismo la 
validez de la prueba. 

El enfoque dc sentido comun para la vali¬ 
dez de contenido que se propone aqut sirve bien 
como mecanismo de sciialamiento que ayuda a 
seleccionar y climinar los reactivos cxistentes 
quc los calificadores expertos consideren 
inapropiados. Sin embargo, no puede identifi- 
car aquellos incxistcntcs que debertan anadirsc 


JUEZ EXPERTO 4 1 

Relation Relation 

dObil luerte 

(reactivo (reactivo 

calificado calllicado 

con 1 o2) con3o4) 


Relation dObil 
(reactivo calllicado 
JUEZ coni o2) 

EXPERTO* 2 

Relation luerte 
(reactivo calllicado 
con 3 o 4) 


Flgura 4-3. Ejemplo hlpotOtico del Modelo do concor¬ 
dancia para la validez de contenido de una prueba de 
100 reactivos. 
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B 

C 
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4 

reactivos 

5 

reactivos 

4 

roactivos 

87 

reactivos 
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a una prueba para ayudar a constituir una re- 
scrva de prcguntas mds reprcsentativas del do- 
minio propuesto. Una prueba puede tener un 
fuertc cocficientc dc validez de contenido y aun 
asf carecer de scntidos m3s sutiles. La cuantifi- 
cacion de la validez de contenido no sustituye 
a una sclcccidn cuidadosa de reactivos. 


VALIDEZ DE FACIE 

Aquf sc hard un breve pardntesis para mencio- 
nar la validez dc Facie, que en realidad no cs, 
de ninguna manera, un tipo de validez. No obs¬ 
tante, el concepto aparece cuando se trata de 
pnicbas y. por tanto, requierc dc una breve expli- 
cacidn. Una prueba tienc validez dc Facie si 
parece vdlida para los usuarios, examinadorcs 
y, en especial, para las personas evaluadas. Esta 
validez es cn realidad una cucstidn de aceptabi- 
iidad social y no una forma tdcnica de validez 
cn la misma categorfa que las de contenido, re- 
lacionada con cl criterio o de constructo (Nevo, 
1985). Dcsde un punto de vista de relaciones 
publicas, es crucial que la prueba posea vali¬ 
dez de Facie —dc otra manera aqucllos que rca- 
licen la prueba se sentirfan insatisfechos y 
dudosos acerca del valor de la prueba psico!6- 
gica. Sin embargo, la validez de Facie no debe 
confundirsc con la objetiva, que se determina a 
travds de la relacidn de las puntuacioncs de prue¬ 
ba con olras fuentes de informacidn. De he- 
cho, una prueba puede poseer una validez 
de Facie exlrcmadamente fuerte —los reactivos 
podnan parecer relevantes cn alto grado para 
aqucllo que supuestamente mide el instrumen- 
to— y. sin embargo, producir puntuacioncs que 
carecen de significado y que no ticncn ningun 
tipo de utilidad predictiva. 



VAUDEZ RELACIONADA 
CON El CRITERIO 


La validez relncionada con cl criterio se dc- 
muestra cuando se confirma que una prueba es 
eficaz para estimar cl desempeno del exami- 


nando en alguna medida de resultado. En este 
contexto, la variable de interds principal es la 
medida de resultado, llamada criterio. La pun- 
tuacion de prueba es dtil sdlo en la medida en 
que proporcionc una base para la prediccidn 
precisa del criterio. Por cjemplo, un examen 
dc ingreso a la universidad que sea razonable- 
mente preciso cn la prcdicci6n del promedio 
de calificacioncs cscolares subsccucnlcs de la 
persona evaluada, posceria validez rclaciona- 
da con cl criterio. 

Dos enfoques diferentes a la evidcncia de 
validez se engloban bajo el encabezado dc va¬ 
lidez rclacionada con el criterio. En la validez 
concurrente, las medidas de criterio se oblie- 
nen aproximadamente al mismo tiempo que las 
puntuacioncs de prueba. Por cjemplo, el diag- 
ndstico psiquiStrico actual dc los pacicntes se- 
rfa una medida apropiada de criterio para 
proporcionar evidcncia de validez para una 
prueba psicodiagndstica de ltfpiz y papel. En la 
validez predictiva, las medidas de criterio se 
obtienen cn el future, en general meses o anos 
despuds de que se obtienen las puntuaciones 
de prueba, como en el caso de calificacioncs 
universitarias pronosticadas a parlir de un exa- 
mcn dc ingreso. Cada uno dc estos dos enfo¬ 
ques es mils adecuado para las diferentes 
situaciones de prueba que se analizan en scc- 
ciones subsccuentes. No obstante, antes dc re- 
visar la naturaleza de la validez concurrente y 
predictiva, se debe examinar una pregunta fun¬ 
damental: icudlcs son las caracterfsticas de un 
buen criterio? 

CARACTERfSTICAS DE UN BUEN 
CRITERIO 

Como se seiialo, un criterio cs cualquier medi¬ 
da dc resultado contra la cual sc valida una prue¬ 
ba. En tdrminos prdcticos, un criterio puede scr 
easi cualquier cosa. Algunos ejemplos ayuda- 
rdn a ilustrar la diversidad de los critcrios posi* 
bles. Una prueba de habilidad de manejo con 
base en un simulador podria validarse contra 
un criterio de “numero de mullas de trdnsilo 
recibidas en los ultimos 12 meses”. Una escala 
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quc mide readaplacidn social podrfa validarse 
contra un criterio dc "niSmero de dfas de in- 
lernamiento en un hospital psiquidtrico en los 
ultimos trcs ados’’. Una prueba de potencial dc 
ventas podrfa validarse contra un criterio de "va¬ 
lor en ddlares de los bienes vendidos durante el 
ano anterior”. El ingenio del autor de la prueba 
determina, en parte, la eleccidn de los critcrios. 
Sin embargo, los criterios deben ser mds que 
sdlo imaginativos, tambidn deben ser confia- 
bles, apropiados y estar librcs dc contamina- 
cion de la prueba en sf. 

El criterio debc ser confiablc en sf mismo, 
si es quc ha de ser un fndice util dc aqucllo que 
mide la prueba. Como recordard cl lector, cl 
significado dc confiabilidad es la consistencia 
de las puntuaciones, por lo quc la necesidad de 
una medida confiable de criterio es intuitiva- 
mente obvia. Despuds de todo, poco confiable 
signifies poco prcdecible. Un criterio poco con¬ 
fiable serd intrfnsccamcntc poco predecible, 
muy aparte de los mdritos de la prueba. 

Considdrese el caso en que las puntuacio¬ 
nes de un examen de ingreso a la universidad 
(la prueba) se utilizan para predeeir el promc- 
dio dc calificaciones subsecuentc (cl criterio). 
La validcz del examen de ingreso puede cstu- 
diarse al calcular la correlacidn (r^) enlre las 
puntuaciones del examen dc ingreso y el pro- 
medio de calificaciones dc una mucstra repre- 
sentativa de estudiantes. Para propdsitos dc un 
estudio dc validez, serfa ideal si a los estudian¬ 
tes se les concedicra la inscripcidn abierta o sin 
selcccidn, de modo que sc evitara una restric- 
cidn del rango en la variable dc criterio. En 
cualquier caso, el coeficiente dc correlacidn 
rcsultante se denomina coeficiente dc validez.* 

El Ifmite superior tcdrico del coeficiente de 
validez sc restringe en funcidn de la confia¬ 
bilidad tanto de la prueba como del criterio: 


* Dc mancra propositi va no nos referimos a dicha esta- 
distica coroo d coeficiente de validcz. Rccudrdcsc quc 
£sia es un conccpio unitario que se determina a travds 
dc multiples fuentes de informacidn quc pueden in- 
cluir la corrclacidn entre prueba y criterio. 


El coeficiente de validez siempre es menor o 
igual a la rafz cuadrada dc la confiabilidad de 
la prueba multiplicada por la confiabilidad del 
criterio. En otras palabras, en la medida en que 
la confiabilidad dc la prueba o del criterio (o 
de ambos) sea baja, tambidn se reducirfi el co¬ 
eficiente de validez. Si se regrcsa al ejcmplode 
un examen de ingreso que se utiliza para pro- 
nosticar el promedio de calificaciones en la 
universidad, debeconcluirse que el coeficiente 
dc validcz para una prueba de cste tipo siempre 
serd menor a +1.00, lo cual se debe en parte a 
la falta de confiabilidad de las calificaciones 
en la universidad, y tambidn en parte a la falta 
dc confiabilidad de la prueba en sf. 

Una medida de criterio (ambidn debe ser 
apropiada para la prueba bajo investigacion. El 
libro de consulta de Standards for Educational 
and Psychological Testing (AERA, APA, NCME, 
1985) incorpora cste importante asunto como 
una norma separada: 

Todas las medidas de criterio deben describirse 
de manera preciaa y hacerse explfcita la 
fundamentactin para eleglrlas como criterios re- 
tadonados. 

Por ejemplo, en el caso dc las pruebas de inte¬ 
rns, en ocasiones es poco claro si la medida de 
criterio debc indicar satisfaccidn, dxito o conti- 
nuidad dc las actividades en cuestidn. La elec- 
cidn entre estas variantes sutiles en el criterio 
debe hacerse con cuidado, con base en un and- 
lisis dc qud es lo que la prueba de interds pre- 
tende medir. 

Un criterio tambidn debe estar libre de con- 
taminacidn de la prueba en sf. Lehman (1978) 
ha ilustrado este punto en un estudio sobre la 
validez rclacionada con el criterio dc una me¬ 
dida del cambio vital. El Schedule of Recent 
Events (Inventario de Acontecimicntos Recientes. 
SRE, Holmes y Rahe, 1967) es un instrumento 
utilizado dc mancra amplia que proporciona un 
fndice cuantitati vo de las acumulaciones de acon- 
tecimientos vitales estresantes (p. ej., divorcio, 
ascenso en cl trabajo, multas de trdfico). Las 
calificaciones en el SRE se corrclacionan de 
mancra modesta con medidas de criterio talcs 
como enfermedad ffsica y altcracidn psicoldgica. 
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No obstante, muchas mcdidas de critcrio aparen- 
temcntc apropiadas incorporan reactivos simila- 
res o identicos a los del SRE, Por ejemplo, con 
frecuencia las pniebas de dcteccidn dc sfntomas 
psiquiiitricos investigan cambios cn alimenta- 
cidn, sucno o actividades sociales. Por dcsgra- 
cia, el SRE incorpora preguntas que investigan 
lo siguiente: 

cambio en habitos de alimentacion 

cambio en habitos de sueno 

cambio en actividades sociales 

Si la prueba de deteccidn contiene los mismos 
reactivos que el SRE, entonces la correlacidn 
entre estas dos medidas se inflara de manera 
artificial. Esta probable fucnte de error en la 
validacidn de la prueba se conoce como conta¬ 
mination del criterio, dado que dste se “con- 
tamina" por su parecido artificial con la prueba. 

La contaminacidn del criterio tambidn es 
posiblc cuando dstc consiste en calificacioncs 
de expertos. Si dstos tambien tienen conoci- 
miento de las puntuaciones de prueba de las 
personas cxaminadas, esta informacidn puedc 
influir (de manera consciente o inconscicnte) 
en sus calificaciones. Cuando se valida una 
prueba contra un criterio de calificaciones de 
expertos, las puntuaciones de prueba deben 
mantcncrse en la mis estricta rcserva hasta que 
se hayan obtenido las calificaciones. 

Ahora que cl lector conoce las caracten'sli- 
cas generalcs dc un buen criterio, se revisard la 
aplicacidn de este conocimiento al andlisis de 
la validcz concurrentc y prcdictiva. 

VAUOEZ CONCURRENT! 

En un estudio de validez concurrente, las puntua¬ 
ciones de prueba y la informacidn de criterio 
se obtienen de manera simultdnea. En general, 
la evidencia concurrente de la validez de una 
prueba es dcseable en el caso dc prucbas de 
rendimiento, aquellas que se utilizan para otor- 
gar licencias o certification y de diagn6slico 
clfnico. Una evaluation dc la validcz concu¬ 
rrente indica el grado en que las puntuaciones 


de una prueba estiman de manera prccisa la 
posiciOn actual de un individuo en el criterio 
relacionado. Por ejemplo, una prueba de rendi¬ 
miento en arilmdtica tendrfa validez concurrente 
si sus puntuaciones pudieran utilizarse para pre- 
decir, con una precision razonable, la position 
actual de los estudiantes en un curso de matc- 
maticas. Un inventario de personalidad tendrfa 
validez concurrente si las clasificaciones diag- 
nOsticas que sc obtienen de 01 concuerdan de 
manera aproximada con las opiniones dc psi- 
quiatras o psicOlogos clfnicos. 

Una prueba con validez concurrente dc- 
mostrada proporciona un atajo para obtener in¬ 
formation que dc otra manera podrfa requerir 
de una inversion considerable de liempo profe- 
sional. Por ejemplo, el procedimiento de asig- 
naciOn de casos en una clfnica de salud mental 
puedc agilizarsc si se utiliza una prueba con 
validez concurrente demostrada para tomar las 
decisiones iniciales de detection. De este modo, 
los pacientes con trastomos graves que requie- 
ren de un estudio clfnico y (ratamiento intensi¬ 
ve inmediato, se identificarfan con rapidez 
mediante una prueba de lOpiz y papel. Por su- 
puesto, las pruebas no tienen el propOsito de 
recmplazar a los especialistas en salud mental, 
pero pueden ahorrar tiempo cn las fases inicia¬ 
les de diagnbstico. 

Es frecuente que las correlaciones entre una 
nueva prueba y otras existentes sc citcn como 
evidencia de validcz concurrente. Esta es un 
arma de dos filos —que las pruebas viejas vali- 
den una nueva— sin embargo, es apropiado si 
se satisfacen dos condicioncs. Primcro, las 
pruebas criterio (existentes) deben haberse 
validado a travds de correlaciones con datos 
conductuales apropiados que no se hayan 
obtenido con pruebas. En otras palabras, la 
red de relacioncs enlrecruzadas debc hacer 
tierra en algun punto con una conducta de la 
vida real. En segundo lugar, el instrumento a 
validar debc medir el mismo constructo que 
las pruebas criterio. Asf, es totalmente apro¬ 
piado que los autores de una nueva prueba de 
inteligencia informen de correlaciones entre 
ella y pilares tales como las escalas Stanford- 
Binet y Wechsler. 
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VALIDEZ predictiva 

En un estudio de validez predictiva, las pun- 
tuaciones de una prueba se utilizan para csti- 
mar medidas de resultado obtenidas en fecha 
posterior. La validez predictiva es de particular 
relevancia para exbmcnes de ingreso y pruebas 
de empleo. Dichas pruebas comparten una fun- 
cibn comun —determinar quidn estb en proba- 
bilidad de tener dxito en una tarca futura. Un 
cnterio relacionado para un examen de ingreso 
a la universidad serfa el promedio de califica- 
cioncs del primer ano, micntras que una prue¬ 
ba de empleo podrfa validarse contra las 
calificacioncs del supervisor despuds de seis 
meses en el trabajo. En la situacibn ideal, tales 
pruebas sc validan durante periodos de ingreso 
abierto (o contratacibn abierta), de modo que 
es posible obtener el rango completo de resul- 
tados en el criterio. De csta manera, el empleo 
futuro de la prueba como instrument de selec- 
ci6n para excluir a los solicitantcs con puntua- 
ciones bajas depended de un fundamento sblido 
cn datos de validacibn. 

Cuando las pruebas se utilizan con propb- 
sitos de prediccibn, es necesario desarrollar una 
ecuacion de regresibn. £sta describe la lfnea 
recta que se ajusta mejor para la estimacibn del 
criterio a partir de la prueba. No se analizarb el 
enfoque estadfstico para ajustar la lfnea recta, 
excepto para mencionar que reduce al mini mo 
la suma de desviaciones cuadradas a partir de la 
lfnea (Ghiselli, Campbell y Zedeck, 1981). 
Para los propbsitos de esta obra, es mbs impor¬ 
tant comprender la naturaleza y funcibn de las 
ecuaciones de regresibn. 

Ghiselli, Campbell y Zedeck (1981) pro- 
porcionan un ejemplo sencillo de la regresibn 
al servicio de la prediccibn, el cual se resume 
aquf. Supbngase que se intenta pronosticar el 
bxito en un empleo Y (valorado por cl supervi¬ 
sor en una escala de sictc puntos que va desde 
el dcsempefio deficiente hasta cl excelente) a 
partir de las puntuaciones en una prueba de 
empleo X (con puntuaciones que van desde un 
nivel bajo de 0 hasta el Ifmite superior de 100). 
La ecuacibn de regresibn: 

Y = .07X ♦ .2 


podrfa describir la lfnea recta que se ajusta mejor 
y, por tanto, producir las prediccioncs mbs pre- 
cisas. Para un individuo que obtienc una pun- 
tuacibn de 55 en la prueba. el pronbstico del 
nivel de desempeno serfa de 4.05 (es decir, 
.07(55) + .2). Una puntuacibn de 33 en la prueba 
produce un nivel de desempetio pronosticado 
de 2.51 (es decir, .07(33) + .2). Las prediccioncs 
adicionales se realizan de la misma manera. 


COEFICIENTE DE VAUDEZ Y ERROR 
ESTANDAR DEL EST1MADO 

La relacibn entre las puntuaciones de una prue¬ 
ba y las medidas de criterio puede expresarse 
de varias mancras diferentes. Quizbs el enfoque 
mbs popular consiste en calcular la correlacibn 
entre prueba y criterio (r^). En esle contexto, la 
correlacibn resultante se conoce como coefi- 
ciente de validez. Entre mbs alto sea el coe- 
ficiente de validez r , mbs prccisa serb la prueba 
en la prediccibn del criterio. En el caso hi poli¬ 
tico donde r fuera LOO, la prueba poseerfa 
validez perfecta y darfa lugar a prcdicciones 
impccables. Por supuesto, no cxiste una prue¬ 
ba asf y los coeficientes de validez se encuen- 
tran de manera mbs habitual en los rangos de 
correlacibn de bajo a medio y en pocas ocasiones 
superan al .80. Pcro ^que tan alto deberfa ser un 
coeficiente de validez? No existe una respues- 
ta general para esta pregunta. Sin embargo, dsta 
puede abordarse de manera indirecta al inves- 
tigar la relacibn entre el coeficiente de validez 
y el error del estimado correspondientc. 

El error cstbndar del estimado (E£ J es 
cl margen de error que puede esperarse en la 
prediccibn de la puntuacibn de criterio, y se 
obtiene de la siguientc fbrmula: 

£E -r -D£ Vl-V 

donde, r^ es el cuadrado del coeficiente de 
validez. y D£ es la desviacibn estbndar de las 
puntuaciones del criterio. Quizbs el lector ha 
observado las semejanzas entre este fndicc y el 
error estbndar de medicibn ( EEM ). De hecho, 
ambos indices ayudan a estimar los mbrgenes 
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de error. El EEM indica el margen dc error de 
inedicion producido por la falta dc confiabilidad 
de la prucba, mientras cl EE eu indica el margen 
de error dc prediccidn causado por la validez 
imperfecta de la prueba. 

El EE at ayuda a responder la pregunta fun¬ 
damental: “(.con cuanta precision pucdc prcde- 
cirsc el desempefio en el criterio a partir de las 
puntuacioncs dc una prucba?” (AERA, APA, 
NCME, 1985). Consicterese la priictica comun 
de tratar de pronosticar el promcdio de califi- 
cacioncs cn la universidad a partir de las cali- 
ficaciones de la preparatoria en una prueba de 
aptitud escolar. Para una prueba especffica 
dc aptitud, supdngasc quc sc dctermina quc cl 
EE iV para prondstico del promedio de califica- 
ciones es dc .2 (en la cscala comun de 0.0 a 
4.0). iQud significa esto para la persona eva- 
luada para quien el prondstico dc calificacio- 
ncs cn la universidad es de 3.1? Como ocurre 
con todas las desviacioncs estdndar, el error 
csUindar del estimado puede utilizarse para 
agrupar los resultados predichos cn un sentido 
probabilfstico. Suponiendo que la distribucidn 
de frccuencia dc las calificaciones cs normal, 
sc sabc que las probabilidades son aproxima- 
damente 68 entre 100 dc que las calificaciones 
predichas para el examinando caigan entre 2.9 
y 3.3 (m4s o menos un EE tJ1 ). De la misma 
manera, se sabc que las probabilidades son 
aproximadamente 95 entre 100 de que la califi- 
cacidn predicha dc la persona cacrd entre 2.7 y 
3.5 (mis o menos dos EE n ). 

(.Cudl es la norma accptablc de cxactitud 
en la prediccidn? No existe una respuesta 
sencilla para csta pregunta. Como podrd com- 
prender el lector a partir de la siguiente discu- 
si6n, las normas dc exactilud en la prediccidn 
son, en parte, juicios de valor. Para explicar por 
qud ocurre esto, es necesario introducir los ele- 
mentos bdsicos de la teorfa dc dccisidn (Taylor 
y Russell, 1939; Cronbach y Glescr, 1965). 

APIICACI 6 N DE LA TEORfA DE DEQSl6N 
A LAS PRUEBAS PSICOL6GICAS 

Los defensores dc la teoria de decisidn dcsta- 
can quc el propdsito de las pruebas psicoldgi- 


cas no cs la mcdicidn cn sf, sino la medicidn al 
scrvicio dc la toma dc decisiones. El adminis- 
trador de personal desea saber a quidn debe 
contratar; el funcionario de admisiones debe 
elegir a quidn inscribir; la junta de libertad con- 
dicional desea conocer cudles delincuentes 
constiluyen un riesgo adccuado para prclibe- 
racion y cl psiquiatra neccsila determinar cud- 
les pacientcs requiercn hospitalizacion. 

El vfnculo entre las pruebas y la toma dc 
decisiones nunca es mds obvio que cn cl con- 
texto de los estudios de validez prcdictiva. 
Muchos dc estos estudios utilizan resultados de 
prueba para determinar quidn estd en probabi- 
lidad dc tencr exito o fracaso en la (area crite¬ 
rio, de modo que, en el future, pueda cxcluirse 
a las personas con bajas puntuaciones en la 
prueba predictiva cn cl caso de inscripciones, 
empleo u otros privilegios. £sta es la fundamen- 
tacidn por la que los funcionarios dc admisiones 
o los contratantes requiercn que los solicitan- 
tes obtengan una cierta puntuacidn minima cn 
un examen apropiado dc ingreso o de empleo 
—pueden citarse estudios previos de validez 
prcdictiva para mostrar que los candidatos con 
calificaciones inferiores a un cierto punto de 
corte cnfrenlardn dificullades considerables en 
sus propdsitos educativos o de empleo. 

Con frecucncia, las pruebas psicoldgicas 
representan un papcl de suma importancia en 
estos tipos dc toma de decisiones institucio- 
nales. En una decisidn institucional tfpica, un 
comit6 —o en ocasiones una sola persona— 
toma un gran numero dc decisiones compara¬ 
bles con base cn una puntuacidn dc corte en 
una o m&s pruebas de scleccidn. A fin dc pre- 
sentar los conceptos clave de la teorfa de dcci- 
si6n, permftasenos simpliftcar un poco las cosas 
y suponcr que unicamente participa una sola 
prueba. 

Aunque la mayor parte dc las pruebas pro¬ 
duce un rango dc puntuacioncs a lo largo de un 
continuo, en general es posible identificar una 
puntuacidn de corte o dc aprobaci6n/rcproba- 
ci6n que divide la muestra en aqu£Uos para los 
cualcs se pronostica cl dxito contra aquellos 
para los que se vaticina el fracaso en cl criterio 
de interns. Supongase que las personas con 
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prediction de dxito tambidn sc sclcccionan para 
contratacidn o admisidn. En este caso, la pro- 
porcidn de personas en el grupo de "prondstico 
dc dxito" se conoce como proportion de se¬ 
lection. Esta puedc variar dc 0 a 1.0, depen- 
dicndo dc la proporcidn de personas que sc 
considcren como buenos candidatos para tener 
dxito cn la medida dc critcrio. 

Si los resultados dc una prueba dc selec¬ 
cidn permiten la dicotomfa simple de "prediccidn 
dc dxito” contra “prediccidn de fracaso", en- 
lonces el resultado subsecucnte en la medida 
dc criterio tambidn puede dividirse dc la mis- 
ma mancra en dos categorfas, a saber, "tuvo 
dxito” y “fracasd". Desde esta pcrspcctiva, todo 
estudio de validez predictiva produce una ma- 
iriz dc dos por dos, como se presenta cn la fi- 
gura 4-4. 

Cicrtas combinaciones de resultados pre- 
dichos y reales son mds probables que otras. Si 
una prueba tiene buena validez predictiva, en- 
tonces la mayoria dc las personas para las que 
se pronostica el dxito lo tendrdn y la mayorfa 
de aqudllas para las que predice el fracaso, fra- 
casardn; dstos son cjcmplos de predicciones 
correctas y sirven para reforzar la validez de un 
instrumento de seleccidn. Los resultados en 
estas dos casillas se conocen como aciertos 
porque la prueba ha hecho una prediccidn 
correcta. 


DESEMPEfiO EN LA MEDIDA DE CRITERIO 


Tuvo 

ado 


FracasO 


TendrS 

Cxilo 

PREDICClON DE LA 
PRUEBA DE SELECClON 

Fracasard 


Pfddicden 

correcta 

(aderto) 

Falso 

posillvo 

(orror) 

Falso 

negative 

(error) 

PredlcckSn 

correcta 

(acierlo) 


Flgura 4-4. Resultados posiblos cuando so utillza una 
piueba de seleccidn para pronostlcar ol dosompefto en 
una medida do criterio. 


Pero ninguna prueba de seleccidn es un 
medio perfccto de prediccidn, dc modo que tam¬ 
bidn son posibles otros lipos de resultados. Al- 
gunas personas para las que se predice el dxito 
fracasardn; dstos casos se conocen como fal¬ 
sos positives; y algunas para las que se prcdicc 
el fracaso, tendrdn dxito si se les da oportuni- 
dad. Estos casos se conocen como falsos ne¬ 
gatives. Los falsos positivos y falsos negativos 
se conocen, cn general, como errores, porque 
cn ambos casos la prueba ha hecho una predic- 
cidn cquivocada. Por tiltimo, la tasa dc aciertos 
es la proporcidn de casos cn los que la prueba 
pronostica dc manera adecuada el dxito o el fra¬ 
caso. es deeir, tasa dc acicrto = (aciertos)/(acier¬ 
tos + errores). 

Los falsos positivos y falsos negativos son 
inevitables cuando se utilizan pruebas de se- 
Icccidn cn la vida real. La tinica mancra de eli- 
minar dichos errores de seleccidn consist!rfa en 
desarrollar una prueba pcrfccta, un inslrumen- 
to que tuviera un coeficiente de validez dc 
+1.00, lo cual significa una correlacidn per- 
fecta con la medida dc criterio. Una prueba 
perfecta es posiblc en tdrminos tcdricos, pero 
nunca se ha observado que exista; no obstante, 
sigue siendo importantc el desarrollo de prue¬ 
bas de seleccidn con validez predictiva muy 
elevada, a fin de reducir al mfnimo los errores 
de decisidn. 

Los dcfcnsorcs dc la tcorfa dc decisidn tic- 
nen dos suposiciones fundamentales acerca de 
la utilizacidn dc pruebas de sclcccidn: 

1. El valor de diversos resultados para la insti- 
tucidn puede expresarse en tdrminos de una 
escala de utilidad comun. Una eseala dc estc 
tipo —pero de ninguna manera la dnica— 
es la de pdrdidas y ganancias. Por ejemplo, 
cuando se utiliza un inventario de intcreses 
para seleccionar a vendedones, una empresa 
puede anticipar ganancias de los solicitan- 
tes que se identifiquen de manera correcta 
como exitosos, pero perderd dinero cuando. 
de manera inevitable, algunos de los sclec- 
cionados no vendan lo suficiente ni siquicra 
para costcar su propio salario (falsos positi¬ 
vos). El costo del procedimiento de seleccidn 
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tambien debe lomarse en cuenta denlro de la 
escala de utilidad. 

2. En las decisioncs dc sclcccidn en institucio- 
ncs, la eslrategia que en general es mas util 
cs aquella que aumenta al maximo la ganan- 
cia promedio en la escala de utilidad (o re¬ 
duce al mfnimo la pdrdida promedio) sobre 
muchas decisiones similares. Por ejemplo, 
£cudl proporcidn de seleccidn produce la 
ganancia promedio m&s grande en la escala 
de utilidad? Por tanto, la maximizacidn cs 
cl principio fundamental de la decisidn. 

La aplicacidn de la teorfa de decisidn es mucho 
mils complicada dc lo que sc ilustra aquf, prin- 
cipalmente debido a la dificultad para encon- 
trar una escala de utilidad comun para diferentes 
resultados. Considerese la diffcil situation del 
funcionario de admisiones de cualquier univer- 
sidad grande. Si la proporcidn de seleccidn es 
bastante estricta, entonccs la mayorfa de los 
estudiantes admitidos tendril dxito, pero algu- 
nos no admitidos tambidn podrfan haber tenido 
dxito y, por tanto, se perderfa su apoyo ccond- 
mico a la universidad (matrfcula, cuotas). No 
obstante, si la proporcidn de seleccidn es de- 
masiado indulgcnte, entonces el porcentaje dc 
falsos positivos (estudiantes admitidos que ten¬ 
don un fracaso subsecuente) se dispara. <,C6mo 
ha dc calcularsc el costo dc un falso positivo? 
Se puede calcular cl costo econdmico —por 
ejemplo, los asesores dedican un cierto nume- 
ro de horas con un salario especificado a orien- 
tar a estos alumnos. Pero ninguna escala dc 
utilidad puede englobar las otras consecuencias 
diversas, como la necesidad de servicios adi- 
cionales de rcgularizacidn (que rcquieren di- 
nero), el aumento en el cinismo de los maestros 
(una cuestidn de moral del personal) y las es- 
pcranzas perdidas dc estudiantes engafiados 
(jcuya decepcidn afccta la pcrcepcidn del pu¬ 
blico acerca de la universidad e incluso pueden 
influir en los subsidios gubemamentaies futu- 
ros!). Es claro que los conccptos estadfsticos 
precisos dc la teorfa de dccisidn simpliftcan en 
extremo las influences complejas que determi- 
nan la utilidad en el mundo real. 

Sin embargo, en ambientes institucionales 
grandes, donde puede identificarse una escala 


de utilidad comun, los principios de la teorfa de 
decision se pueden aplicar a los problcmas de se- 
leccidn con resultados que instan a la reflexidn. 
Por ejemplo, Schmidt, Hunter, McKenzie y 
Muldrow (1979) analizaron el impacto poten- 
cial de utilizar la Programmer Aptitude Test 
(Prueba de Aptitud del Programador; PAT, 
Hughes y McNamara, 1959) en la seleccidn de 
programadores de computadoras para cl gobier- 
no federal. Basaron su an&lisis en los siguien- 
tes hechos y suposiciones: 

1. Las puntuaciones de la PAT y las medidas 
posteriores de desempeno en programacidn 
dentro del trabajo se corrclacionan dc ma- 
nera bastante sustancial; el coeficicnte de 
validez de la PAT es .76 (hecho). 

2. El gobierno contrata a 600 nuevos progra¬ 
madores cada ano (hecho). 

3. El costo dc la prueba es de cerca dc 10 ddla- 
res por persona examinada (hecho). 

4. Los programadores permanecen en el em- 
pleo aproximadamente nueve anos y reciben 
aumentos de sueldo de acuerdo con una tasa 
dc salarios cspecffica (hecho). 

5. Los supervisores pueden cstimar de manera 
precisa la productividad anual en ddlares de 
las programadores con desempeno bajo, pro¬ 
medio y superior (suposicidn). 

Con base en estos hechos y suposiciones, 
Schmidt y colaboradores (1979) compararon la 
utilizacidn hipotdtica de la PAT contra otros 
procedimicntos de seleccidn de menor validez. 
Dado que la utilidad de una prueba se determi- 
na en parte por el porcentaje de solicitantes que 
se seleccionan para el empleo, los investigadores 
tambidn examinaron el impacto dc diferentes 
proporciones de seleccidn sobre la productivi¬ 
dad total. En cada caso, estimaron el aumento 
anual en productividad, valuada en ddlares, dc 
utilizar la PAT en vcz dc un proccdimiento al¬ 
ternative y menos eficaz. En general, se estimtS 
que el uso de la PAT aumentaba la productivi¬ 
dad en decenas de millones de d61ares. El au¬ 
mento especffico estimado dependio de la 
proporcidn dc seleccidn y del coeficiente de 
validez de los procedimientos alternatives 
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hi porticos (cuadro4-l). Por ejemplo, si sc con- 
irataba a 80% de los solicitantcs (proporcidn 
je seleccidn de .80). la utilizacidn de la PAT 
aumentaria la productividad del gobiemo fede¬ 
ral en. cuando menos, 5.6 millones de dolares 
(si cl procedimicnto altcmativo tuviera un co- 
eficiente de validez de .50) y posiblemcntc hasta 
16,5 millones de ddlares (si dicho procedimien- 
10 no tuviera alguna validez). Si la proporcidn 
de sclecci6n fuera bastante pcqucna, cl uso de 
la PAT para la seleccidn elevaria la productivi- 
dad aun mds —posiblemente hasta cerca de 100 
millones de ddlares. Schmidt y colaboradores 
(1979) concluyeron que "el impacto de los 
procedimientos vdlidos de seleccidn en la pro¬ 
ductividad de la fuerza laboral es considerable- 
men te mds grande de lo que ha crefdo la 
mayorfa de los psicdlogos dedicados a la selec¬ 
cidn de personal". 

En general, las grandes organizacioncs que 
toman docenas o cientos de decisiones simila- 
res de contratacidn cada aho, pueden benefi- 
ciarse de la aplicacidn de la teorfa de decisidn 
a los procedimientos de seleccidn, micntras que 

Cuadro 4-1. Incremento de la 
productividad estimada (en millones 
de ddlares) para la utilizacidn a un 
aho de la Prueba de aptitud 
del programador 


Validez verdadera del 
procedlmiento 


Proporcidn 


de seleccidn 

.00 

.20 

.30 

.40 

.50 

.05 

97.2 

71.7 

58.9 

46.1 

33.3 

.10 

82.8 

60.1 

50.1 

39.2 

26.3 

20 

66.0 

48.6 

40.0 

31.3 

22.6 

.30 

54.7 

40.3 

33.1 

25.9 

18.7 

.40 

45.6 

34.6 

27.6 

21.6 

15.6 

.50 

37.6 

27.7 

22.8 

17.8 

12.9 

.60 

30.4 

22.4 

18.4 

14.4 

10.4 

.70 

23.4 

17.2 

14.1 

11.1 

8.0 

.80 

16.5 

12.2 

10.0 

7.8 

5.8 


Fu«nt*: Reimpreao con autorizacidn de Schmidt. F, L. Hunter. 
J E, McKenzie, R C. y Muldrow, T W (1979). Impact ot valtd 
Wecton procedures on work-torc« product/vlty. Journal ol Applied 
Psychology, 64. 609-626 


es posiblc que las empresas mas pequehas no 
posean una base de datos suficiente para apli- 
car las metodologfas complejas inhcrentes a cste 
enfoque. Cuando es posible, la utilizacidn del 
principio de maximizacidn en conjunto con una 
escala mensurable de utilidad, esta teorfa es muy 
prometedora. Por ejemplo, Schmidt, Hunter, 
Outcrbridgc y Trattner (1986) estiman que el 
uso de medidas vdlidas de capacidad cognitiva 
en lugar de procedimientos ajenos a pruebas 
(p. ej., rcqucrir un tftulo cspecffico) para la sc- 
leccidn de personal, aumentarfa la productivi¬ 
dad de los trabajadores del gobiemo federal en 
8 mil millones de ddlares en el curso del cargo 
laboral tfpico de 13 ados. 

TABLAS TAYLOR-RUSSELL 

En cl contcxto de la teorfa de decisidn. debe- 
n'an describirse las tablas estadfsticas publica- 
das por Taylor y Russell (1939), las cuales 
permiten que el usuario de pruebas determine 
la proporcidn esperada de solicitantes exitosos 
seleccionados con la utilizacidn de una de elias. 
Por obvias razones, estas pautas se conocen 
como tablas Taylor-Russell. A fin de utilizar- 
las, el examinador debe especificar: 1) la vali¬ 
dez predictiva de la prueba, 2) la proporcidn de 
seleccidn y 3) la tasa base para los solicitantes 
exitosos. Un cambio en cualcsquiera de estos 
factores altcrard la precision de la prueba para 
la selecci6n. 

En general, la validez predictiva de una 
prueba se conoce a partir de cstudios antcrio- 
res y consiste en r , la correlacidn entre la prue¬ 
ba y el criterio. La proporcidn de seleccidn es 
la cantidad de solicitantes que se seleccionan 
(en general debido a que se pronostica que ten- 
dr.in dxito). La tasa base es la proporcidn de 
solicitantes exitosos que se seleccionarfan con 
los mdtodos actuales, sin el beneficio de la nuc- 
va prueba. (En el caso extreme, la tasa base es 
la proporcidn de solicitantes exitosos que se 
elegirfan de manera alcatoria sin cl beneficio 
de algun procedimicnto de scleccidn.) Cuando 
se conocen estos tres factores, se pueden con¬ 
sular las tablas Taylor-Russell para determinar 
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la proporcidn de dxitos esperados a travds de la 
aplicacidn de la prueba. De esta manera, el usua- 
rio de dsta puede determinar el grado al cual el 
empleo de una nueva mejorarfa la seleccidn por 
encima de la tasa base obtenida con los mdto- 
dos existentes. 

Quizes un ejemplo especffico ayudard a 
aclarar la aplicacidn potcncial de las tablas 
Taylor-Russell (cuadro 4-2). Supdngasc que la 
tasa base para los solicitantes exitosos es de .60, 
lo cual significa que 60% de los solicitantes 
aceptados con los mdtodos actuates resulta ser 
exitoso. Supbngasc tambidn que la proporciOn 
de seleccidn es .50, lo cual significa que se se* 
lecciona a 50% de todos los solicitantes. Lo que 
es m&s, imagfnesc que una nueva prueba tiene 
un coeficiente de validez de .40, que especifica 


la correlacidn entre puntuaciones de prueba y 
criterio. Bajo estas suposiciones, las tablas 
Taylor-Russell suministran la proporcidn espe- 
rada de dxitos mediante la utilizacidn de la nuc- 
va prueba, que resulta ser de .73, una mejorfa 
sustancial por encima de la tasa base actual de 
.60 para la seleccidn exitosa. 

La conclusi6n m.1s fascinantc que surge de 
las tablas Taylor-Russell es que las pruebas con 
validez “deficiente” pueden, de todas maneras, 
mejorar a un nivel sustancial la precisidn en Is 
seleccion —si la proporci6n de seleccidn es su- 
ficientemente baja. Considdrese una prueba con 
validez de tan s6lo .20, que no parece muy im- 
presionante; por lo comun, en la mayorfa dc las 
pruebas la mayor parte de los coeficicntcs de 
validez son mucho mds altos. Supdngase tambidn 


Cuadro 4-2. Proporcion esperada de dxitos para una prueba de seteccidn de una 
validez dada, con una proporcidn especifica de seleccibn, para una tasa base de .60 


Proporcldn de seleccion 


Validez 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.00 

.60 

.60 

.60 

.60 

.60 

.60 

.60 

.60 

.60 

.60 

.60 

.05 

.64 

.63 

.63 

.62 

.62 

.62 

.61 

.61 

.61 

.60 

.60 

.10 

.68 

.67 

.65 

.64 

.64 

.63 

.63 

.62 

.61 

.61 

.60 

.15 

.71 

.70 

.68 

.67 

.66 

.65 

.64 

.63 

.62 

.61 

.61 

.20 

.75 

.73 

.71 

.69 

.67 

.66 

.65 

.64 

.63 

.62 

.61 

.25 

.78 

.76 

.73 

.71 

.69 

.68 

.66 

.65 

.63 

.62 

.61 

.30 

.82 

.79 

.78 

.73 

.71 

.69 

.68 

.66 

.64 

.62 

.61 

.35 

.85 

.82 

.78 

.75 

.73 

.71 

.69 

.67 

.65 

.63 

.62 

.40 

.88 

.85 

.81 

.78 

.75 

.73 

.70 

.68 

.66 

.63 

.62 

.45 

.90 

.87 

.83 

.80 

.77 

.74 

.72 

.69 

.66 

.64 

.62 

.50 

.93 

.90 

.86 

.82 

.79 

.76 

.73 

.70 

.67 

.64 

.62 

.55 

.95 

.92 

.88 

.84 

.81 

.78 

.75 

.71 

.68 

.64 

.62 

.60 

.96 

.94 

.90 

.87 

.83 

.80 

.78 

.73 

.69 

.65 

.63 

.65 

.98 

.96 

.92 

.89 

.85 

.82 

.78 

.74 

.70 

.65 

.63 

.70 

.99 

.97 

.94 

.91 

.87 

.84 

.80 

.75 

.71 

.66 

.63 

.75 

.99 

.99 

.96 

.93 

.90 

.86 

.81 

.77 

.71 

.66 

.63 

.80 

1.00 

.99 

.98 

.95 

.92 

.88 

.83 

.78 

.72 

.66 

.63 

.85 

1.00 

1.00 

.99 

.97 

.95 

.91 

.86 

.80 

.73 

.66 

.63 

.90 

1.00 

1.00 

1.00 

.99 

.97 

.94 

.88 

.82 

.74 

.67 

.63 

.95 

1.00 

1.00 

1.00 

1.00 

.99 

.97 

.92 

.64 

.75 

.67 

.63 

1.00 

1.00 

1.00 

1.00 

1.00 

1.00 

1.00 

1.00 

.86 

.75 

.67 

.63 


Fuenle: Reproduddo de Taylor. H. C. y Russel, J. T. (1939). The relationship ot validity coefficients lo the practical effectiveness ol tests 
in selection Journal ol Applied Psychology. 23. 565-578 Dominio publico 
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que la (asa base para la seleccidn exitosa es de 
60, lo cual probablemente es una tasa base 
[talista para muchas formas de seleccidn de 
personal. Lo que es mis, supdngase que la pro- 
porcidn de seleccidn es muy rigurosa, digamos 
05, lo cual significa que sdlo se considera acep- 
table a 5% de los solicitantes y, por tanto, es a 
quienes sc selccciona. Bajo cstas suposiciones, 
la proporcidn esperada de dxitos a travds del 
uso de la prueba es de .75, una mejorfa neta de 
15% por encima de la tasa base de .60. 

pVAUPEZ DE CONSTRUCTO 

El tipo final de validez que se analiza en esta 
unidad es la validez de constructo, la cual es, 
sin duda, la mis diffcil y esquiva de todas. Un 
constructo es una cuaiidad o rasgo tedrico, in¬ 
tangible, en cl cual difteren los individuos 
(Messick, 1995). Ejemplos de constructos in- 
cluyen capacidad de liderazgo, hostilidad 
sobreconlrolada, depresidn e inteligcncia. Obsdr- 
vese en cada uno de estos ejemplos que los 
constructos se infieren de la conducta, pero son 
mis que dsta en sf. En general, a un nivel tedri- 
co se considera que los constructos tienen cier- 
ta forma de cxistencia independiente y ejercen 
influencias amplias, pero en cierto grado posi- 
bles de predecir, sobre la conducta humana. Una 
prueba que se disene para medir un constructo 
debe estimar la existencia de una caractcrfstica 
inferida, subyaccntc (p. ej., capacidad de lide¬ 
razgo), con base en una muestra limitada de 
conducta. La validez de constructo se refiere a 
la idoneidad de cstas inferences acerca del 
constructo subyacente. 

Todos los constructos psicoldgicos poseen 
dos caracterfsticas en comun: 

1. No existe un solo referente extemo suficicn- 
te para validar la existencia del constructo, 
es decir, dste no puede definirse en tdrminos 
operacionales (Cronbach y Meehl, 1955). 

2. No obstante, puede obtenerse una red de su¬ 
posiciones entrelazadas a partir de la teorfa 
existente acerca del constructo (AERA, 
APA. NCME, 1985). 


Se ilustrarin estos elementos con referenda al 
constructo de la psicopatia (Cleckley, 1976), una 
constelacidn de personalidad que se caracteri- 
za por conducta antisocial (mentira, robo y vio- 
lencia ocasional), una falta de culpa y vergllenza 
e impulsividad.* Con toda seguridad, la psico- 
patfa es un constructo en cuanto a que no exis¬ 
te una sola caracterfstica o resultado conductual 
suficientc para determinar quidn presenta una 
fuerte psicopatia y quidn no. En promedio, po- 
drfa esperarse que a los psiedpatas se les encar- 
celara con frecuencia, pero eso tambidn ocurre 
con la mayoria de los delincuentes comunes. Lo 
que es mis, de alguna manera muchos psiedpa- 
tas exitosos evitan que se les aprehenda alguna 
vez (Cleckley, 1976). La psicopatia no puede 
estimarse sdlo a partir de los races con la ley. 

Sin embargo, a partir de la teorla existente 
sobre la psicopatia se puede deducir una red de 
suposiciones entrelazadas. Sc suponc que el 
problema fundamental en la psicopatia es una 
deficiencia en la capacidad para sentir excita- 
cidn emocional —ya sea empatfa, culpa, temor 
al castigo o ansiedad bajo estrds (Cleckley, 
1976). De esta valoracidn se desprenden varias 
predicciones. Por ejemplo, los psiedpatas de- 
ben mentir de manera convincente, tener ma¬ 
yor tolerancia al dolor flsico, mostrar menor 
excitacidn autdnoma en estado de reposo y 
meterse en problemas debido a su falta de inhi- 
bicidn conductual. Asl, para validar una medi- 
da de la psicopatia, necesitarfan verificarse 
varias diferentes expectativas basadas en esta 
teorla acerca de ella. 

La validez de constructo alafie a las prue¬ 
bas psicoldgicas que afirman medir atributos 
psicoldgicos complejos, multifacdticos y vincu- 
lados con la teorla como la psicopatia, inteli- 
gencia, capacidad de liderazgo y similares. El 
punto crucial a comprendcr acerca de la validez 
de constructo es que “ningun criterio o univer- 
so de contenido se accpta como completamen- 
te adecuado para definir la cuaiidad que se 
mide” (Cronbach y Meehl, 1955). Por tanto, la 
demostraci6n de la validez de constructo siempre 


* El constructo de la psicopatia cs muy similar a lo que 
ahora sc denomina trastomo de personalidad antiso¬ 
cial (American Psychiatric Association, 1994). 
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dependc dc un programs dc investigacidn que 
utilice los di versos procedimicntos que se esque- 
matizan en las siguientes secciones. Para eva- 
luar la validez de cons true to de una prueba, debe 
acumularse una variedad de evidencia a partir 
de numerosas fuentes. 

Aunque establccer la validez de constructo 
de una prueba es un proceso largo y complejo, 
los diversos procedimientos estSn disenados 
para responder a una pregunta crucial: con base 
cn los conceptos tcdricos actuates sobre el 
constructo que la prueba afirma medir, ^se en- 
cuentran los tipos de relaciones con criterios 
ajenos a la prueba que la teorfa predice? Con- 
siddrese el concepto de psicopatfa, que se ana- 
lizd antes, como lo mide la escala de Desviacibn 
psicopdtica (Dp) del MMPI y el MMPI-2. Un 
pequefio trozo de evidencia que apoya la validez 
de constructo de esta escala es el descubrimien- 
to de que los cazadores que “por descuido" le 
habi'an disparado a una persona tenfan eleva- 
ciones significativas en Dp en comparacidn con 
otros cazadores (Cronbach y Meehl, 1955). 
Dicha conclusibn encaja de manera adecuada 
con el concepto tebrico de psicopatfa, en espe¬ 
cial en lo que se reftere a la falta de inhibicibn 
conductual. Por supuesto, se neccsitarfan mu- 
chas otras lfneas dc evidencia para confirmar 
la validez de constructo de la escala Dp. Por 
tanto, puede observarse que la investigacidn de 
la validez de constructo no es esencialmente 
diferente de los procedimientos cientfficos ge- 
neraJes para confirmar una teorfa. 

Muchos tedricos en psicometna conside- 
ran a la validez de constructo el concepto uni- 
ficador para todos los tipos de evidencia de 
validez (Cronbach, 1988;Guion, 1980; Messick. 
1995). Segun este punto de vista, los estudios 
individuates de validez de contenido, concu- 
rrente y predict! va se consideran tan sdlo como 
evidencia de apoyo en la busqueda acumulativa 
de validacidn del constructo. 

I ENFOQUES DE LA VALIDEZ 
DE CONSTRUCTO 


^Cdmo es que un autor de pruebas determina si 
un nuevo instmmento poscc validez de cons¬ 


tructo? Como se indied antes, ningun procedi- 
miento unico serd suficiente para esta diffcil 
tarea. La evidencia de la validez de constructo 
puede encontrarse en casi cualquier estudio 
empfrico que examine las puntuaciones de 
prueba de grupos apropiados de individuos. La 
mayor parte de los estudios de validez de 
constructo caen dentro de una de las siguientes 
categorfas: 

• Andlisis para determinar si las subpruebas o 
reactivos de una prueba son homogbneos y, 
por tanto, miden un solo constructo. 

• Estudio de los cambios rclacionados con el 
desarrollo para determinar si son consisten- 
tes con la teorfa del constructo. 

• Investigacidn para evaluar si las diferencias 
grupales en las puntuaciones dc una prueba 
son consistentes con la teorfa. 

• Andlisis para determinar si los efectos de la 
intervencidn sobre las puntuaciones de una 
prueba son consistentes con la teorfa. 

• Correlacidn dc la prueba con otras pruebas y 
medidas relacionadas y no relacionadas. 

• Andlisis factoriales de las puntuaciones de 
prueba en relacidn con otras fuentes de infor- 
macidn. 

A continuacion sc analizan con mayor detallc 
estas fuentes de evidencia de validez de 
constructo. 


HOMOGENE1DAD DE UNA PRUEBA 

Si una prueba mide un solo constructo, enton- 
ces es probable que los reactivos (o subpruebas) 
que la componen sean homogbneos (esto tam- 
bibn se conoce como consistencia interna). En 
la mayor parte de los casos, la homogeneidad 
se incorpora dentro de la prueba durante el pro¬ 
ceso de desarrollo que se analiza con mayor 
detalle en la siguiente unidad. La finalidad del 
desarrollo de una prueba es la seleccidn dc 
reactivos que formen una escala homogenca. 
El mbtodo que mbs se utiliza para lograr esta 
meta es la correlacidn de cada reactivo poten- 
cial con la puntuacidn total y la seleccidn de 
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fcactivos que muestren aJtas correlacioncs con 
la puntuaci6n total. Un procedimiento analogo 
consiste en correlacionar las subpruebas con la 
puntuacidn total en las primeras fases del desa¬ 
rrollo de la prueba. De cste modo, pueden 
revisarse las escalas irregulares que no se co- 
rrelacionan en algdn grado m/nimo con la pun¬ 
tuacidn total antes de que el instrumento se 
publique para utilizacidn general. 

La homogeneidad es un primer paso im- 
portante en la certificacidn de la validez de 
constructo de una prueba nueva, pero en sf mis- 
ma, cs una evidencia ddbil. Kline (1986) ha re- 
saltado circularidad del procedimiento: 

Si todos los reactivos en una reserve de 6stos 
estuvleran muy lejos del bianco y no mldieran 
aquello que esperamos. se setecdonarfan sogun 
el crilerio de su correlaclbn con la puntuacidn to¬ 
tal, lo cual nunca puede funcionar. Ha de sena- 
larse que el mismo argumento se aplica a la 
lactorizacidn de la reserva de reactivos. Induso 
es posibte que los reactivos deflclentes tengan 
un (actor general. Esta objeclbn es sensata y so 
ba de refutar de manera empirica. Aunque se 
haya encontrado un oonjunto de reactivos homo- 
gbneos a traves de un anblisis de reactivos, de 
todas maneras liene que presentarse evidencia 
acerca de su validez. Asl. conslrulr una prueba 
homogbnea no es suficiente, se deben llevar a 
cabo estudios de validez. 

Adcmls de demostrar la homogeneidad de los 
reactivos. un autor de una prueba debe pro- 
porcionar otras multiples fuentes de validez de 
constructo. las cuales se analizan a continua- 
ci6n. 


CAMBIOS APROPIADOS RELACIONADOS 
CON a DESARROLLO 

Puede suponersc que muchos constructos mues- 
tran cambios regulares relacionados con la edad, 
desdc la infancia temprana hasta la edad adul¬ 
ts y quiz4 m4s alld. Considdrese como cjemplo 
cl constructo del conocimiento de vocabulario. 
Desde los inicios de las pruebas de intcligen- 
cia. a principios del siglo XX. se sabe que el 
conocimiento del vocabulario aumenta de ma¬ 
nera exponencial desde la infancia temprana 


hasta la infancia tardfa. Investigaciones m&s 
rccientcs demuestran que el vocabulario aumen¬ 
ta, aunque a un paso m&s lento, hasta la vejez 
(Gregory y Gemert, 1990). Entonces, para cual- 
quier prueba nueva de vocabulario, un trozo 
importante de evidencia de validez de construc¬ 
to serfa que los individuos de mayor edad tie- 
nen mejores puntuaciones que aqulllos mds 
j6venes, suponiendo que se mantengan cons- 
tantes los factores de educacidn y salud. 

Por supuesto, no todos los constructos se 
prestan a prondsticos acerca de cambios vincu- 
lados con cl desarrollo. Por ejemplo, no es cla- 
ro si una escala que mida “asertividad" deberfa 
mostrar un patrdn de aumento, disminucidn o 
estabilidad de las puntuaciones a medida que 
se avanza en edad. Los cambios del desarrollo 
serfan irrelcvantes para la validez de constructo 
de una escala de este tipo. Tambicn se deberfa 
mencionar que los cambios apropiados del de¬ 
sarrollo constituyen solamente una pieza del 
rompccabczas de la validez de constructo. Este 
enfoque no proporciona informacidn acerca de 
cu41 es la relacidn del constructo con otros. 


H DIFERENCIAS GRUPALES 
P CONSISTENTES CON LA TEORIa 

Una manera de reforzar la validez de un nuevo 
instrumento consiste en mostrar que, en pro- 
medio, las personas con antecedentes y carac- 
terfsticas diferentes obtienen puntuaciones de 
prueba consistentes con la teorfa. En tlrminos 
cspecfficos, las personas que se consideran al- 
tas en el constructo que mide la prueba debe- 
rfan obtener puntuaciones altas, mientras las 
personas con cantidades supuestamente bajas 
del constructo deberfan obtener puntuaciones 
bajas. 

Crandall (1981) elabord una escala de inte¬ 
rns social que ilustra el empleo de las diferen- 
cias grupales consistentes con la teorfa en el 
proceso de validaci6n del constructo. Con base 
en la teorfa de Alfred Adler, Crandall (1984) 
definid cl interns social como un “interds y 
preocupacidn acerca de los demas". Para me- 
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dir este constructo, diserib un instrumento bre¬ 
ve y sencillo que consta de 15 reactivos de elec- 
ci6n forzada. En cada uno, una de las dos 
altemativas incluye un rasgo que se relaciona 
de manera estrecha con el concepto de interns 
social (p. ej., servicial), mientras la otra opcibn 
consiste cn un rasgo igualmcnte atractivo, pero 
sin relacibn con lo social (p. ej., viveza de in- 
genio). A1 individuo se le instruye para que “eli- 
ja el rasgo que usted valore mils". Cada uno de 
los IS reactivos se califican con uno si se elige 
el rasgo de interns social y con cero si se elige el 
otro; asf, las puntuaciones (otales en la Social 
Interest Scale (Escala de Interns Social; SIS) 
pueden irde 0 a IS. 

El cuadro 4-3 presenta las puntuaciones 
promedio de 13 grupos bien definidos de parti- 
cipantes. El lector observari que los individuos 
en probabilidad de tener un alto nivel de inte¬ 
rns social (p. ej., monjas) obtienen las puntua- 
ciones promedio m&s altas en la SIS, mientras 
las mbs bajas las obtienen personas supuesta- 
mentc egocdnlricas (p. ej., modclos) y aqudllos 
con evidente conducta antisocial (delincuentes). 
Estas conclusiones son consistentcs con la teo- 
rfa y sustentan la validez de constructo de este 
interesante instrumento. 


EFECTOS DE LA INTERVENCION 
CONSISTENTES CON LA TEORfA 

Otro enfoque de la validez de constructo con¬ 
siste en mostrar que las puntuaciones de una 
prueba cambian en la direccidn y cantidad apro- 
piadas en reacci6n a intervenciones plancadas 
o no planeadas. Por ejemplo, las puntuaciones 
de los ancianos en una baterfa de prueba de 
orientacibn espacial deberfan de aumentar des¬ 
puds de que dstos recibicran entrenamiento 
cognitivo disciiado de manera especffica |>ara 
aumentar sus capacidades de orientacibn espa¬ 
cial. En tdrminos mis precisos, si la baterfa dc 
una prueba posee validez de constructo, sc pue- 
de predecir que las puntuaciones en orientacibn 
espacial deberfan mostrar mayor incremento de 
la preprueba a la posprueba que el encontrado 
en capacidades no relacionadas que no son el 
objetivo del entrenamiento especial (p. ej., ra- 
zonamiento inductivo, velocidad perceptual, 
razonamiento numdrico o razonamiento verbal). 
Willis y Schaie (1986) encontraron un patrbn 
de este tipo en resultados de prueba en un estu- 
dio de entrenamiento cognitivo con personas 
ancianas, lo cual sustenta la validez de cons¬ 
tructo de su medida de orientacibn espacial. 


Cuadro 4-3. Puntuaciones medias en la Escala de Interns social 
para grupos seleccionados 


Qrupo 

N 

Puntuacibn media 

Hermanas ursulinas 

6 

13.3 

Mtombros adultos de la Iglesla 

147 

11.2 

Voluntaries para caridad 

9 

10.8 

Estudiantes de educacldn media distlnguldos por alto interds social 

23 

10.2 

Estudiantes universitarios distlnguldos por alto interds social 

21 

9.5 

Empieados universitarios 

327 

8.9 

Estudiantes universitarios 

1 784 

8.2 

Estudiantes universitarios distinguidos por bajo interns social 

35 

7.4 

Modelos profesionales 

54 

7.1 

Estudiantes de educacidn media distinguidos por bajo interns social 

22 

6.9 

Ateos y agnOsticos adultos 

30 

6.7 

Delincuentes convictos 

30 

6.4 


Fuento: Adaplado con autor izaciOn de Crandall. J, (1981) Theory and measurement ot social interest Empirical tosts ot Attred AdteCs 
concept Nueva York: Columbia University Press 
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yflJDEZ CONVERGENT! 
y DE DISCRIMINAddN 

La valldez convergente se demuestra cuando 
una prueba se corrclaciona mucho con otras 
variables o pruebas con las que comparte una 
sU perposici6n de constructs. Por ejemplo, dos 
pruebas disenadas para medir diferentes tipos 
it inteligencia deberfan compartir de todas 
maneras una cantidad considerable del factor 
general cn inteligencia como para producir una 
fuerte correlacidn (digamos .5 o mis) cuando 
se aplican de manera conjunta a una mucstra 
heterogdnea de individuos. De hccho, cualquier 
prueba nueva de inteligencia que no se corre- 
lacione al menos en cierto grado con las medi- 
das existentes seria sumamente sospechosa, con 
base en que no posce validez convergente. 

La validez de discriminacion se demues- 
ira cuando una prueba no se correlaciona con 
variables o pruebas con las cuales deberfa te- 
ner difercncias. Por ejemplo, el interds social y 
la inteligencia no tienen rclacidn tcdrica, y las 
pruebas con estos dos constructs deberfan 
correlacionarse en senlido negativo, si es que 
acaso lo hacen. 

En un artfculo clisico que con frecuencia 
se cita, pero en pocas ocasiones se emula. 


Campbell y Fiske (1959) propusieron un dise- 
no experimental sistemitico para confirmar de 
manera simultinca la validez convergente y la 
de discriminacidn de una prueba psicoldgica. 
Su disefio se denomina matriz multirrasgo- 
multimetodo y requiere de la evaluaci6n de dos 
o mis rasgos a travds de dos o mis mdtodos. El 
cuadro 4-4 proporciona un ejemplo hipotdtico 
de cste enfoque. En este ejemplo, se miden tres 
rasgos (A, B y C) a travds de tres mdtodos (1,2 
y 3). Por ejemplo, los rasgos A, B y C podrian 
ser interds social, creatividad y dominio. Los 
mdtodos 1, 2 y 3 podrfan ser un inventario de 
autoinforme, calificaciones de compafictos y 
una prueba proyecliva. Asf, Al representarfa 
un inventario de autoinforme de interds social, 
B2 una calificacidn de compaficros acerca de 
creatividad, C3 una medida de dominio obte- 
nida de una prueba proyectiva y asf sucesiva- 
mente. 

Obsdrvese que en este ejemplo se estudia- 
ron nueve pruebas (los tres rasgos sc miden, 
cada uno, con ires mdtodos). Cuando cada una 
de dstas se aplica en dos ocasiones al mismo 
grupo de individuos y se correlacionan las 
puntuaciones en todos los pares de pruebas, el 
resultado es una matriz multirrasgo-multimd- 
todo (cuadro 4-4). Esta matriz es una fuente 


Cuadro 4-4. Matriz hlpotdtlca multirrasgo-multimdtodo 

Metodo 1 Mitodo 2 Metodo 3 



Rasgos 

A i 

b , 

c, 


B 2 C 2 

M6todo 1 

A > 

89) 







5l '— 

^89) 





c i 

38 


4™) 



Mitodo 2 

A 2 

57 *' 


"091 

93) 



b 2 

C 2 

L n .. 

.si'' 

l'f'' 


6&\(94) 

59 5&\(84) 

Mdtodo 3 

*3 

56 

:22" 

-iri 

67* 

'"42"" 331 


b } 

V?'' 

„ 58''' 

'.12 : 

4J' 

'.,66''-.34 | 


r 

lU... 

l'f'' 

45 J 

u¥. 

32''._58 J 


Aj Bj Cj 



Las letras A 8 y Cseretieren a los rasgos; los subindices 1,2y 3 se relieren a los m6todos La matriz consists de coefidentcj 
cottelac»6n (so omitleron los decimates). Wase texto 

f minis: Reproducido con autorizacxjn de Campbell. DTy Fiske, D W (19S9) Convergent and discrimananl validation by the multlvall- 
"kllllmethod matrix. Psychological Bulletin, 56, 81-IOS 
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prolffica de datos sobre confiabilidad, validcz 
convergente y validcz dc discrimination. 

Por ejemplo, las correlaciones en la diago¬ 
nal principal (entre pardntesis) son coeficien- 
tes de confiabilidad para cada pmcba. Micntras 
mds altos sean cstos valorcs, mejor y de prefe- 
rencia scrfa mejor que aquf se observaran valo- 
res cn los rangos de .80 o .90. Las correlaciones 
en las tres diagonalcs mds pequenas (en negri- 
tas) proporcionan evidencia sobre la validez 
convergente —mcdicidn del mismo rasgo a tra- 
vds de diferentes mdtodos. Estas correlaciones 
deben ser fuertes y positivas, como se muestra 
aquf. Vdase que el cuadro tambiln incluye co¬ 
rrelaciones entre los diferentes rasgos que se 
miden con el mismo mdtodo (en los tridngulos 
sdlidos) y diferentes rasgos medidos con dife¬ 
rentes mdtodos (tridngulos punteados). Estas 
correlaciones deben ser las mds bajas de todas 
dentro de la matriz, ya que proporcionan evi¬ 
dencia dc validez discriminativa. 

La metodologfa de Campbell y Fiske (1959) 
es una contribution importantc para la com- 
prensiOn del proceso dc validation de una prue- 
ba. Sin embargo, poner en prdctica de mancra 
completa este procedimiento requiere por lo co- 
mun de un compromiso monumental por parte 
de los investigadores. Es mds frecuentc que los 
autores de pruebas obtengan datos sobre vali¬ 
dez convergente y discriminativa cn retazos, en 
lugar dc producir una matriz completa de inter- 
correlaciones. Meier (1984) proporciona una de 
las pocas ejecuciones realistas de la matriz mul- 
tirrasgo-multimtiodo en un examen de la vali¬ 
dcz del constructo de “agotamiento". 

ANALISIS FACTORIAL 

El andlisis factorial es una tdcnica estadfstica 
cspecializada que es de particular utilidad para 
la investigation de la validez de constructo. En 
el tema 8A. Pruebas de aptitud y andlisis 
factorial, se analiza con mayores detalles esta 
tecnica; aquf se proporciona un avance rdpido, 
de modo que cl lector pueda apreciar cl papcl del 
andlisis factorial cn el estudio de la validcz 
de constructo. El propOsito del andlisis facto¬ 


rial consiste en identificar cl numero mfnimo 
de determinantes (factores) que se requieren 
para explicar las intercorrelaciones entre una 
baterfa dc pruebas. El objetivo en el andlisis 
factorial es encontrar el conjunto mds pequeno 
de dimensiones, llamadas factores, que puedan 
explicar la disposition observada de intercorre- 
laciones entre las pruebas individualcs. Un en- 
foque tfpico en el andlisis factorial consiste en 
aplicar una baterfa de pruebas a varios cientos 
de personas y dcspuOs calcular una matriz de 
correlation a partir de las puntuacioncs en to- 
dos los posibles pares de pruebas. Por ejemplo, 
si se aplican 15 pruebas a una muestra dc pa- 
cientes psiquidtricos y neurolOgicos, el primer 
paso en el andlisis factorial consiste en calcu¬ 
lar las correlaciones entre las puntuaciones de 
los 105 pares posibles de pruebas.* Aunque 
puede ser factible observar ciertos agrupamien- 
tos de pruebas que midan rasgos comunes, es 
mds tfpico que la mayor cantidad de datos que 
se encuentran en una matriz de correlation sea 
simplementc demasiado compleja como para el 
que el ojo humano la analice de manera eficaz 
sin ninguna ayuda. Por fortuna, los procedi- 
mientos de andlisis factorial ejecutados por 
computadora buscan este patrOn de intcrcorre- 
lacioncs, identifican un pequeno ntimero de 
factores y dcspuOs produccn una tabla de car- 
gas factorials. De hccho, una carga factorial 
es una correlation entre una prueba individual 
y un solo factor. Asf, las cargas factoriales pue- 
den variar entre -1.0 y +1.0. El resultado final 
del andlisis factorial es una tabla que presents 
la correlation dc cada prueba con cada factor. 

Una tabla de cargas factoriales ayuda a 
describir la composition factorial de una prueba 
y, por tanto, proporciona informaci6n relacio- 
nada con la validez de constructo. Se ilustrard 
este puntocon los datos analftico-factoriales de 
un estudio dc la Prueba dc categorfas. Esta prue¬ 
ba es una relati vamente compleja de formation 


* La formula general para cl numero dc apareamientos 
entre N pruebas es N(N-l)/2. Asf. sc aplican 15 prue¬ 
bas, habrd 15 x 14/2 o 105 posibles pares de pruebas 
individuates. 





■ 
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de conceptos disenada para ser diferente de las 
medidas psicomdtricas tradicionaJes de la inte- 
ligencia y superior a cl las cn la detcccidn de 
trastomos neuroldgicos (Reitan y Wolfson, 1985). 
Si en realidad la Prueba de categorfas mide algo 
diferente de las pruebas tradicionales de inleli- 
gencia, entonces deberfa tener fuertes cargas en 
uno o mis factores no representados por las 
subpruebas del WAIS. Dicha conclusion forta- 
jeceria la validez de constructo de la Prueba de 
categorfas al distinguirla de las medidas tradi¬ 
cionales de inteligencia. 

Lansdell y Donnelly (1977) aplicaron la 
Escala Wechsler de Inteligencia para Adultos, 
la Prueba de categorfas y la Prueba de golpeteo 
de dedos a 94 pacientes psiquiitricos y neurold- 
gicos. Las puntuaciones de prueba se sometie- 
ron a un anilisis factorial que produjo las cargas 
factoriales que se muestran en cl cuadro 4-5. 
Obsdrvese que las subpruebas verbales del 
WAIS tienen las cargas mis elevadas en el fac¬ 
tor I, que seguramente cs un factor de compren- 
siOn verbal. La Prueba de categorfas tienen una 
carga minima en este factor, lo cual indica que 
las capacidadcs verbales no son de particular 
importancia para cl desempeno adecuado en 
esta prueba. Disefto con cubos (.74) y Ensam- 
ble de objetos (.73) tienen sus cargas mis fuer¬ 
tes en el factor II y, por lo comun, se les coloca 
en el factor de organizaciOn perceptual.* Por 
desgracia, la Prueba de categorfas ticne una 
carga sustancial (.82) en este factor y s6lo cn 
dstc. Al mcnos para esta muestra de participan- 
tes, parece ser que la Prueba dc categorfas es 
tan s6lo una medida alternativa dc las habilida- 
des de organizaci6n perceptual y no es una prue¬ 
ba nueva y diferente, como muchos de sus 
usuarios querrfan afirmar. De manera inciden¬ 
tal. debe decirse que el factor III parece medir 
libertad de la distractibilidad y el factor IV pa- 
recc ser una medida pura de velocidad motora. 


* Obsdrvcse que los seres humanos son quiencs propor- 
cionan la ciiqucta para un factor, con base cn un anili- 
Sis de las pruebas que tienen las cargas mis elevadas 
en rf. Es concebible que dos investigadores pudieran 
utilizar nombres diferentes para el mismo factor —por 
ejemplo, referirse al factor II como organizaciin 
perceptual como analLsis visocspacial. 


Cuadro 4-5. Cargas factoriales 
para la Prueba de categorfas, 
Prueba de golpeteo con los dedos 
y subpruebas del WAIS 


Carga factorial 


Prueba 

1 

II 

III 

IV 

Informacldn 

88 

.15 

.07 

.07 

Comprensidn 

.83 

-.03 

.06 

-.09 

Aritmblica 

.43 

.26 

.67 

-.12 

Semejanzas 

.78 

.30 

.17 

.02 

RetenciOn de dfgitos 

.23 

.08 

.83 

.12 

Vocabularlo 

.92 

.07 

.06 

.01 

Claves 

.25 

.31 

.21 

.61 

Figures incompletas 

.64 

.50 

-.24 

-.01 

Diseno con cubos 

.39 

.74 

.06 

.20 

Ordenacidn de 

.50 

.60 

.12 

-.01 

dibujos 





Composicton de 





objetos 

.29 

.73 

.00 

.31 

Categories 

.19 

.82 

.11 

-.18 

Prueba de golpeteo 

.07 

-.08 

.18 

.76 


con los dedos 


Fuento: Adaptado con autorizacidn de Lansdetl, H. y Donnelly, 
E. F. (1977). Factor analysis ol the Wechsler Adult Intelligence 
Scale Subtests and the Halstead-Rertan Category and Tapping 
Tests Journal ol Consulting and CUncal Psychology. 45,412-416 


r PREOCUPACIONES EXTERNAS 
£-!j A LA VAUDEZ Y AMPLIAClbN DEL 
§41 ESPECTRO DE LA VAUDEZ 
DE UNA PRUEBA 


Sc comienza esta seccidn con una revision dc 
las preocupaciones externas a la validez, que 
incluyen los efectos colaterales y consecuen- 
cias involuntarias de las pruebas. Al reconocer 
la importancia dc los aspcctos externos a la 
validez, los psicOlogos confirman que la deci¬ 
sion de utilizar una prueba implica considera- 
ciones socialcs, legates y polfticas que van mis 
alii de las cuestiones tradicionales de la vali¬ 
dez tdcnica. En una cxplicaciOn relacionada, 
tambien se revisari la manera en que el intcris 
en las preocupaciones externas a la validez ha 
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estimulado a varios tc6ricos a ampliar este con- 
cepto. Como descubrird el lector, las implica- 
ciones de valor y las consccuencias socialcs 
estdn incluidas ahora dentro del espectro cada 
vez mas amplio de la validez de una prueba. 

Incluso si una prueba cs vdlida, imparcial 
y justa, la decisidn de utilizarla puede estar go- 
bemada por consideraciones adicionales. Cole 
y Moss (1989) plantcan los siguientes factores: 

• ^Cudl cs el propdsito para el que se emplea la 
prueba? 

• iA qud grado se logran los propdsitos a tra- 
vfs de las acciones que sc toman? 

• /Cuales son los posibles efectos colaterales o 
consecuencias involuntarias del empleo de 
una prueba? 

• iCutllcs altemativas posibles para una prue¬ 
ba podrfan satisfacer el mismo propdsito? 

Aqu( sdlo se revisan las preocupaciones exter- 
nas a la validez que tienen mayor relevancia y 
se muestra como han servido para ampliar el 
espectro de la validez de una prueba. Los lec- 
tores que desecn mayores detallcs accrca de 
estos temas deberfan consultar AERA, APA, 
NCME (1999), Cole y Moss (1989), Cronbach 
(1988) y Jensen (1980, cap. 15). 


EFECTOS COLATERALES INVOLUNTARIOS 
DE LAS PRUEBAS 

El resultado deseado de la utilizacidn de una 
prueba psicoldgica no necesariamente es la uni- 
ca consecuencia. Tambidn son posibles diversos 
efectos colaterales y, de hecho, son probables. 
El examinador debe determinar si los benefi- 
cios de aplicar una prueba superan los costos 
de los efectos colaterales potenciales. Lo que 
es mds, al anticipar los efectos colaterales 
involuntarios. el examinador podrfa desviarlos 
o disminuirlos. 

Cole y Moss (1989) citan cl ejemplo del 
empleo de pruebas psicoldgicas para determi¬ 
nar la elegibilidad para educaci6n especial. 
Aunque el resultado deseado es ayudar a ios 
estudiantes a aprendcr, cl proceso de identifi- 


car a los estudiantes como clegibles para edu- 
cacidn especial puede producir numerosos efec¬ 
tos colaterales negativos: 

• Los ninos identificados pueden sentirse anor- 
males o ineptos. 

• Otros ninos les pueden poner apodos. 

• Los macstros pueden considerar que estos 
niftos no mercccn atencidn. 

• El proceso puede producir salones segrega- 
dos por raza o clase social. 

La consideracidn de los efectos colaterales dc- 
berfa influir la decisidn de un examinador 
de ulilizar una prueba particular para un pro- 
posito espcciTico. feste podrfa elegir dc manera 
apropiada no utilizar una prueba para un pro- 
pdsito meritorio, si los probables costos de los 
efectos colaterales superaran a los beneficios 
esperados. 

Considdrese la prdctica comun en ados an- 
teriores dc utilizar el Inventario Multifasico de 
Personalidad de Minnesota (MMPI) para ayu¬ 
dar a seleccionar candidatos para puestos de 
imposicidn del orden publico como oficiales 
de poliefa o ayudantes de comisario. Aunque 
cl MMPI se discrid originalmcnte como auxi- 
liar en el diagndstico psiquidtrico, la investiga- 
cidn subsecuente indied que tambidn era util 
en la idcntificacidn de personas inadccuadas 
para una camera en la poliefa (Hargrave, 1985; 
Hiatt y Hargrave, 1988). En particular, los agen- 
tes del orden publico que produjeran perfilcs 
en el MMPI con elevaciones leves (p. ej., pun- 
tuacidn T dc 65 a 69) en las Escalas F (frecuen- 
cia), Masculinidad-Femineidad, Paranoia e 
Hipomanfa tendfan a estar implicados en gra¬ 
ves acciones disciplinarias; los agentes del or- 
den publico que produefan perfilcs mds 
“defensivos” en el MMPI, con elevaciones me- 
nores en las escalas clfnicas, tendfan a no par- 
ticipar en dichas acciones. Asf, la prueba posefa 
una validez modesta para el digno propdsito de 
seleccionar a los candidatos a la poliefa. Pero 
ninguna prueba, ni siquiera el muy respetado 
MMPI, es pcrfectamentc vdlida. Se hardn a un 
lado a algunos buenos solicitantes debido a que 
sus resultados en el MMPI son marginalcs. 
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Quizi su puntuaci6n T cn la Escala de Paranoia 
e s de 66 o en la Escala de Hipomanfa es de 68. 
fa el MMPI. una puntuacion T de 70 se consi¬ 
der con frecuencia como el Ifmite superior del 
wngo "normal". 

Un efecto colateral involuntario de utilizar 
e | MMPI para la vaioracidn de los solicitantes 
a puestos de orden publico es que los candida¬ 
tes al trabajo que no tengan Ixito con alguna 
jnstitucidn pueden quedar senalados con una 
etiqueta patoldgica como psiedpatas, esquizo- 
frtnicos o paranoides. Esta etiqueta puede suigir 
a pesar de los mejores esfuerzos del psicdlogo 
asesor, quien es posible que nunca haya ulili- 
zado algun tdrmino peyorativo en el informe 
de evaluacidn del candidato. Por lo comun, la 
etiqueta se aplica cuando los administradores 
en el departamento que hizo la referenda exa- 
minan el perfil del MMPI y ven que el candida¬ 
to obtuvo su puntuacidn mas alia en una escala 
con el horrendo tftulo de Dcsviacidn psicopd- 
tica, Esquizofrcnia. Hipocondria o Paranoia. 
Por desgracia, la comunidad de seguridad 
publics puede ser una fratemidad muy ccrrada. 
Es comun que los jefes de poliefa y comisarios 
intercambien informes verbales acerca de sus 
solicitantes de empleo, de modo que una eti¬ 
queta peyorativa puede seguir al candidato de 
un lugar a otro, excluyendo de manera perma- 
nentc al solicitante del ingreso a la profesidn 
de seguridad ptiblica. Las rcpercusiones no s6lo 
son injustas para el candidato sino que tambidn 
hacen surgir el espectro de demandas legales 
contra la institucidn y el psicdlogo asesor. Si se 
consideran todos estos elementos, el psicdlogo 
asesor puede encontrar prefcrible cl empleo de 
una prueba tecnicamente menos vdlida para el 
mismo prop6sito, en particular si el instrumen- 
to alternative no produce estos efectos colate- 
rales involuntarios. 

La sensibilidad renovada hacia las cueslio- 
nes extemas a la validez ha producido que va- 
rios tedricos en el campo de las pruebas amplfen 
su definicidn de validez de una prueba. En la 
siguiente seccidn se revisan estos recientes 
avances, advirtiendo al lector que aun queda 
por surgir un consenso final acerca de la natu- 
raleza de la validez de una prueba. 


AMPLIA06N DEL ESPECTRO 
DE VALIDEZ DE UNA PRUEBA 

Para este momento, el lector se habrd familiari- 
zado con la perspective estrecha y tradiciona- 
lista en el empleo de pruebas que afirma que 
dsta es v.1lida si mide "lo que pretende medir”. 
El mensaje implfcito de esta perspective es que 
la validez tdcnica es la base m&s esencial para 
recomendar la utilizacidn de una prueba. Des¬ 
puds de todo, las pruebas v&lidas proporcionan 
informacidn precisa acerca de las personas eva- 
luadas —iy qud podrta haber de malo en ello? 

De manera rcciente, varios tedricos en 
psicomctrfa ban introducido una definicidn mds 
amplia, funcionalista, de validez que asevera 
que una prueba es vilida si satisface el propd- 
sito para cl cual se utiliza (Cronbach, 1988; 
Messick, 1995). Por cjcmplo, podrfa utilizarse 
una prueba de rendimiento en lectura para iden- 
tificar a estudiantes a fin de asignarlos a la sec- 
cidn de regularizacidn. Segiin la perspectiva 
funcionalista, la prueba serfa v;ilida—y, pot tan- 
to, su empleo serfa apropiado— si los estudiantes 
selcccionados para regularizacidn recibicran de 
hecho algun beneficio acaddmico de esta apli- 
cacidn de la prueba. 

La perspectiva funcionalista reconoce de 
manera explfcita que quien valida la prueba 
tiene la obligacidn de determinar si una prdeti- 
ca tiene consecuencias constructivas para los 
individuos e instituciones y, en especial, para 
proteger de los resultados adversos (Messick, 
1980). Asf, la validez de una prueba es un jui- 
cio valorativo general acerca de la idoneidad y 
pertincncia de las inferencias y acciones que 
fluyan de las puntuaciones de dsta. 

Messick (1980, 1995) afirma que el con- 
cepto nuevo y mds amplio de validez descansa 
sobre cuatro bases, fetas son: 1) evidcncia tra- 
dicional de validez de constructo; por ejemplo, 
validez convergente y de discriminacidn ade- 
cuadas, 2) un andlisis de las implicaciones de 
valor de la interpretacidn de la prueba, 3) evi- 
dencia de la utilidad de las interpretaciones de 
una prueba en aplicaciones particulares y 4) una 
cstimacidn de las consecuencias sociales po- 
tenciales y reales, incluyendo efectos colaterales, 
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del empleo de dsta. Una prueba vdlida es aque- 
lla que responde de manera apropiada a las cua- 
tro facetas de validez. 

La conception mas amplia de validez de una 
prueba cs a todas luces polOmica y algunos leO- 
ricos prefieren la perspecti va tradicional de quc 


las consccucncias y valores son importantes, 
pero independientes de las cuesiiones tdcnicas 
de su validez. Todos pueden estar de acuerdo 
con una cucstidn: la mediciOn psicolOgica no 
es un empeno neutral, cs una ciencia aplicadaque 
ocurre dentro de un contexto social y politico. 


I^RESUMEN 


1. La validez de una prueba es el grado en el 
cual nude aquello quc afirma medir. Una 
prueba es vdlida en el grado en quc las 
inferencias quc se realizan a partir de ella 
son apropiadas, significativas y utiles. La 
confiabilidad es un precursor nccesario pero 
no suficiente de la validez. 

2. Por tradiciOn, las diferentes maneras de 
acumular evidencia de validez se han agru- 
pado en tres categorfas: validez de conteni- 
do, validez relacionada con el criterio y 
validez de constructo. Sin embargo, la vali¬ 
dez es un concepto unitario y cualquier es- 
tudio empfrico puedc tener influcncia sobre 
la validez de una prueba. 

3. La validez de contenido se determina por el 
grado al que las preguntas, tareas o reactivos 
en una prueba constituyen una muestra re- 
presentativa del universo de conductas quc 
la prueba intenta examinar. Dicha validez 
es fdcil de garantizar en el caso de rasgos 
bien definidos, como la capacidad ortogrd- 
fica, pero es mds dtffcil de cspecificar cuan- 
do se trata de rasgos explfcitos, como la 
ansiedad. 

4. Una prueba tiene validez de Facie si parccc 
vdlida para los usuarios de la prueba, exa- 
minadores y, en especial, para las personas 
examinadas. La validez de Facie es impor- 
tante para la aceptabilidad social de una 
prueba, pero es irrelevante para propdsitos 
psicometricos. 

5. La validez relacionada con el criterio se de- 
muestra cuando una prueba es eficaz para 
predeeir el desempeiio en una medida apro¬ 
piada de resultado. Dicha validez engloba 


a la concurrcnte, en la que las medidas de 
criterio se obtienen aproximadamente al 
mismo tiempo que las puntuaciones de la 
prueba que se utiliza como medio de pre- 
dicciOn, y a la validez predictiva, en la que 
las medidas de criterio se obtienen en cl 
futuro. 

6. Cuando las pruebas se utilizan con prop6- 
sitos de prediccidn, es nccesario desarro- 
liar una ecuacidn de regrcsiOn. £sta describe 
la linea recta que se ajusta mejor (aquclla 
que reduce al minimo la suma de desvia- 
ciones cuadradas con respccto a la Ifnea) 
para estimar cl criterio a partir de la prue¬ 
ba. Por cjcmplo, la ecuacidn Y =.07X + .2 
podrfa utilizarse para predeeir las califica- 
ciones laborales a partir de una prueba de 
empleo. 

7. La correlacidn enlrc prueba y criterio (r ^ 
se conoce como coeficiente de validez. 
Mientras mas alta sea la correlacidn, mils 
prccisa serd la prueba en la estimacidn del 
criterio. 

8. El error estdndar del estimado (EE t J es el 
margen de error a esperar en la puntuacidn 
de criterio predicha. Estc se obticnc de la 
siguiente formula: 

donde r es el coeficiente de validez. 

9. Los defensores de la tcorfa de decision des- 
tacan quc una prueba debe auxiliar en la 
toma precisa de decisiones. La prediccidn 
precisa del exito contra el fracaso en una 
medida de resultado es esencial. Las pruebas 
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deben evitar dos tipos de errores: los falsos 
positivos, en los que se pronostica que los 
individuos tcndran dxito, pero fracasan; y 
los falsos negativos, en los que se predice 
cl fracaso de estos, pero ticncn dxito. 

10. La teorfa de decisidn supone que los costos 
de las predicciones precisas e imprccisas 
pucden medirsc en una escala comun de 
utilidad, como la de ganancia/pdrdida. Una 
juposicidn fundamental de la teorfa de de- 
cision es la maximizacidn: En las dccisio- 
nes institucionalcs de scicccion. la estratcgia 
mds apropiada de utilizacidn de pruebas es 
aquella que aumenta al mdximo la ganan- 
cia promedio y reduce al mfnimo la pdrdi- 
da promedio. 

11. Un constructo es una cualidad o rasgo tedri- 
co, intangible, en el que los individuos di- 
fieren. La validez de constructo tiene que 
ver con las pruebas psicoldgicas que a fir¬ 
man medir atributos psicoldgicos comple- 
jos, multifacdticos y vinculados con la teorfa 
como la capacidad de liderazgo, la hostili- 
dad sobrecontrolada y la intcligencia. 

12. Los estudios de validez dc constructo cacn 
por lo general dentro de una de estas cate- 
gorfas: andlisis de la homogencidad de los 
reactivos; evaluacidn de los cambios aso- 


Bterminos y conceptos 

CLAVE 

Validez 

p. 118 

Validez de contenido 

p. 119 

Validez de Facie 

p. 122 

Validez relacionada con el 


criterio 

p. 122 

Validez concurrentc 

p. 124 

Validez predictiva 

p. 125 

Ecuacidn de regresidn 

p. 125 

Cocficiente de validez 

p. 125 

Error estdndar del estimado 

p. 125 

Teorfa de decisidn 

p. 126 

falsos positivos 

p. 127 


ciados con el desarrollo y de cambios gru- 
pales en la prueba; analisis dc los efectos 
de la intervencidn; y correlacidn y analisis 
factoriales de las puntuaciones de una prue¬ 
ba en rclacidn con otras fuentes dc infor- 
macidn. En cada caso, la pregunta crucial 
es si los resultados son consistcntes con la 
teorfa subyacente del constructo que se 
mide. 

13. Las preocupacioncs extemas a In validez in- 
cluycn los efectos colatcrales y consecuen- 
cias involuntarias de las pruebas. Porejem- 
plo, una evaluacidn valida para asignacidn 
a educacidn especial puede causar que los 
ninos identificados sc sientan anormalcs o 
ineptos. La considcracidn de los efectos 
colatcrales deberfa influir sobre la dccisidn 
del examinador de utilizar una prueba par¬ 
ticular para un propdsito especffico. 

14. La perspectiva nueva, mils amplia y funcio- 
nalista de la validez dc una prueba afirma 
que dsta es vdlida si satisface el propdsito 
para el cual sc utiliza. Por ejemplo. la vali¬ 
dez de una prueba de rendimiento en lectu¬ 
re podrfa vincularse con la regularizacidn 
exitosa de los estudiantes con discapacidad 
para la lecture que se hayan idcntificado con 
la prueba. 


Falsos negativos 

p. 127 

Tasa base 

p. 129 

Constructo 

p. 131 

Validez de constructo 

p. 131 

Escala homogenea 

p. 132 

Validez con vergente 

p. 135 

Validez dc discriminacidn 

p. 135 

Matriz multirrasgo-multimdtodo 

p. 135 

Analisis factorial 

p. 136 

Carga factorial 

p. 136 

Preocupaciones extemas a la 
validez 

p. 137 



















































































TEMA 4B 

Construccibn de pruebas 


Dofinicibn de la prueba 

Seloccibn de un melodo de escalamiento 

Metodos representatives de escalamiento 

Construccibn de reactivos 

Examende reactivos 

Revisibn de la prueba 

Publicacibn de la prueba 

Resumen 

Tbrminos y conceptos clave 


La creacibn de una nueva prueba impli- 
ca lanto una ciencia como un arte. Un autor de 
pruebas debe elegir estrategias y matcrialcs y 
despuds tomar decisiones continuas de investi- 
gacibn que a feet man la calidad de su instru- 
mento en germinacibn. El propbsito de esla 
seccibn consiste en analizarel proceso mediantc 
cl cual los psicbmetras creen pruebas vdlidas. 
Aunquc se examinaran muchas cuestiones in- 
dependientes, a todas las vincula un tema en 
comun: las pruebas vdlidas simplemente no 
apareccn en cscena en plena madurez —sur- 
gen de mancra lenta de un proceso evolutivo, 
en desarrollo. que se funda en la validez desde 


el mismo principio. En este tema se enfatizarbn 
los aspectos basicos del desarrollo de pruebas; 
el lector que desee una prescntaci6n mbs avan- 
zada debera consultar a Kline (1986) y Nunnally 
(1978). 

La construccibn de pruebas consta de seis 
etapas entrelazadas: 

Definicibn de la prueba. 

Seleccibn de un mbtodo de escalamiento. 

Construccibn de los reactivos. 

Examen de los reactivos. 

Rcvisibn de la prueba. 

Publicacibn de la prueba. 
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Como anblisis preliminar, pucden resumirse es- 
tos pasos de la siguicntc manera: la definici6n 
de la prucba consiste en la delimitacibn de su 
alcancc y propbsito, los cualcs debcn conocer- 
sc antes de que el aulor pueda proseguir con su 
construccibn. La selecci6n de un metodo de 
escalamiento es un proceso en cl que sc csta- 
blecen las reglas mediante las cualcs sc asig- 
nan numeros a los resultados de la prueba. La 
construccibn de los rcactivos es tanto un arte 
como una cicncia y es aquf donde puede 
requerirse la crcatividad del autor. Una vez que 
sc ticnc disponiblc una versibn preliminar de la 
prueba, los autores en general la aplican a una 
mueslra de tamafio modesto de individuos, a 
fin de rcunir los datos iniciales sobre las carac- 
terfsticas de los reactivos. El examen de bstos 
implica una variedad de procedimientos esta- 
disticos conocidos como analisis de reactivos, 
cuyo propbsito consiste en determinar cualcs 
reactivos deben conservarse, revisarse y elimi- 
narse. Con base en el analisis de rcactivos y en 
otras fuentes de informacibn, se revisa la 
prueba. Si las revisiones son sustanciales, es 
posible que se requieran nuevos reactivos y 
prepruebas adicionalcs con nuevos individuos. 
Asf, la construccibn de pruebas implica un cir- 
cuito de realimentacibn donde se podnan pro¬ 
duct 2, 3 y 4 bosquejos de un instrumento 
(figure 4-5). La publicacibn de la prueba es el 
paso final. Adcmbs de difundir los materiales 
de una prueba, el autor debe producir un ma¬ 
nual fbcil de comprendcr pare el usuario. A 
continuacibn se examinardn con mbs detallc 
cada uno de estos pasos. 



DEFINIQ6N de la prueba 


DefinioCn de la prueba 


SetecaCn de un metodo de escalamiento 



Construccibn de los reactivos 


Examen de los reactivos 


Revision de la prueba 


PubllcaoOn de la prueba 


Figure 4-5. Procesos de construccibn de la prueba. 


mento es diferente y mejor que los existentes 
depende del autor. 

Considbrese la sobrccogedora tarea que 
enfrenta un autor de pruebas que propone otro 
instrumento de intcligencia general. Con doce- 
nas de dichos instrumentos en existcncia, £cbmo 
es posible que uno nuevo haga una contribu- 
cibn util al campo? La respuesta es que la in- 
vcstigacibn contempordnea aumenta de manera 
continua la comprensibn acerca de la inteligen- 
cia e impulsa a buscar nuevas maneras y mds 
utiles de medir este constructo multifacbtico. 

Kaufman y Kaufman (1983) proporcionan 
un buen modelo del proceso de definicibn de la 
prueba. Al proponer la Batcrfa de Evaluacibn 
de Kaufman para Nifios (K-ABC), una nueva 
prueba de la inteligencia general en nifios, los 
autores enumeraron seis objetivos primarios que 
definen el propbsito dc la prueba y la distinguen 
de las medidas existentes: 


A fin de construir una nueva prueba, el autor 
debe tener una idea clara de aquello que ha de 
medir y de cbmo difiere dsta de los instrumen- 
tos existentes. Dado que la existcncia de las 
pruebas psicolbgicas cstb a punto de entrar en 
su segundo siglo y ya que se han publicado 
miles de pruebas para este momento, es claro 
que la responsabilidad de probar que un instni- 


1. Mide la inteligencia desdc una fuerte base 
tebrica y de investigacibn. 

2. Scpara cl conocimiento objetivo adquirido 
de la capacidad para resolver problemas 
desconocidos. 

3. Produce puntuaciones que se traducen cn 
intervencibn educativa. 

4. Incluye tareas novedosas. 
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5 . Es fdcil de aplicar y objetiva de calificar. 

Es sensible a las divcrsas neccsidades de los 
prcescolares, grupos minoritarios y ninos 
excepcionales (Kaufman y Kaufman, 1983). 

Como el lector descubrird en un tema poste¬ 
rior, la K-ABC represcnta un viraje interesante 
con respccto a las pruebas tradicionales de in- 
teligencia. Por ahora, la cuestidn importante es 
que los autores de este instrumento reciente 
explicaron su propdsito de manera explfcita y 
plantearon un nuevo enfoquc para medir la in- 
teligencia, mucho antes de que comenzaran a 
construir los reactivos de la prueba. 


I SELECCibN DE UN MEtOOO 
PE ESCALAMIENTO 


El propdsito inmediato del examen psicoldgi- 
co es asignar numeros a las respuestas en una 
prueba de modo que pueda juzgarse que la per¬ 
sona examinada tiene una mayor o mcnor can- 
tidad de la caracterfstica medida. Las reglas 
mediante las cuales se asignan numeros a las 
respuestas defincn el mdtodo de escalamiento. 
Los autores de pruebas seleccionan un mdtodo 
de este tipo que se adecue en forma Optima a la 
manera en que han conceptuado el rasgo o ras- 
gos medidos por su prueba. Ningun mdtodo de 
escalamiento es uniformemente mejor que 
olros. En el caso de algunos rasgos, la clasifi- 
cacidn ordinal de parte de jueces expertos po- 
dria ser el mejor enfoque de medicidn; en el 
caso de otros, la medicidn escalar compleja de 
los dates de autoinforme puede producir las 
medidas m« 1 s validas. 

Existen tantos mdtodos precisos de escala- 
miento disponibles para los psic 6 metras que nos 
sentiremos satisfechos con proporcionar aquf 
sdlo una muestra representativa. Los lectores 
que descen tener una reseda mds completa y 
detallada deben consultar a Gulliksen (1950), 
Nunnally (1978) o Kline (1986). No obstante, 
antes de revisar los mdtodos dc escalamiento 
scleccionados, es ncccsario que se presente un 
concepto relacionado, los niveles de medici 6 n. 


de modo que el lector pueda apreciar mejor las 
difercncias entre los mdtodos de escalamiento. 

NIVELES DE MEDICION 

Segun Stevens (1946) todos los numeros ex- 
trafdos de los instrumentos de medicidn dc cual- 
quier tipo pueden colocarsc dentro de una de 
cuatro categorfas jerdrquicas: nominal, ordinal, 
de intervalo o de razdn. Cada categorfa define 
un nivel de medicidn; el orden que se lista es 
dc mcnos a mds informativo. 

En las escalas nominales, los numeros sir- 
ven s61o como nombres de categorfas. Por ejem- 
plo, cuando se obtienen datos para un cstudio 
demogrfifico, un investigador podrfa codificar 
a los varoncs como " 1 " y a las mujeres como 
“2". Vdase que los numeros son arbitrarios y 
no designan si hay “mds" o “menos” de una 
cosa. En las escalas nominales, los numeros son 
sdlo una forma simplificada de denominacidn. 

Las escalas ordinales constituyen una 
forma de ordenacidn o clasificacidn. Si se le 
pidiera a profesores universitarios que clasifi- 
caran cuatro automdviles cn cuanto a cudl pre- 
ferirfan poseer, el orden preferido podrfa ser 
"1” Cadillac, “2" Chevrolet, “3” Volkswagen, 
“4" Hyundai. Obsdrvese en este caso que los 
numeros no son intercambiables. Una clasifi¬ 
cacidn de " 1 ” es “mds M que una clasificacidn 
de “2” y asf sucesivamente. El “mds” se refiere 
al orden de preferencia. Sin embargo, las escalas 
ordinales no proporcionan informacidn sobre 
la fortaleza relativa de las clasificaciones. En 
este ejemplo hipotdtico no se puede saber si los 
profesores universitarios tienen una fuerte pre¬ 
ferencia por los Cadillac por encima de los 
Chevrolet o sdlo hay una diferencia marginal 
en su preferencia. 

Una escala de intervalo proporciona in¬ 
formacidn accrca dc clasificacidn, pero tambidn 
provee una medida para estimar las difercncias 
entre clasificaciones. Para construir una escala 
de intervalo se podrfa pedir a los profesores 
universitarios que calificaran en una escala de 
1 a 100 qud tanto les gustarfa poseer los cuatro 
automdviles antes citados. Supdngase que las 
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calificacioncs promcdio van como sigue: 
Cadillac, 90; Chevrolet, 70; Volkswagen, 60; 
Hyundai. 50. A partir de esta informacidn se 
puede inferir que la prefcrcncia por un Cadillac 
cs mucho mis fuerte que por un Chevrolet que, 
a su vez, dene una prcferencia levemente mis 
fuerte que el Volkswagen. Mis importante aiin 
es que tambidn puede suponerse que los inter- 
valos entre los puntos en esta cscala son aproxi- 
madamente iguales: La diferencia entre la 
prefercncia de los profesores por un Chevrolet 
y un Volkswagen (10 puntos) es mis o menos 
la misma que existe entre un Volkswagen y un 
Hyundai (tambidn 10 puntos). En pocas pala- 
bras, las cscalas de intervalo se basan en la su- 
posicidn de unidades o intervalos de igual 
tamaiio para la cscala subyaccnte. 

Una cscala de raz6n dene todas las carac- 
tcrfsdcas de una escala de intervalo, pero tam¬ 
bidn posee un punto cero conceptualmcnlc 
significadvo, en el que existe auscncia total de 
la caracterfstica medida. Las propiedades csen- 
cialcs de los cuatro niveles de medici 6 n se re- 
sumen en la figura 4-6. 

Las escalas de razdn son poco comunes 
en la medicidn psicoldgica. Considerese si existe 
algdn senlido significativo en el que pueda pen- 
sarse que una persona dene cero inteligencia. 
No, en realidad. Lo mismo ocurre con la ma¬ 
yor parte de los constructos en psicologfa: los 
puntos cero significadvos simplcmcnte no cxis- 
ten. Sin embargo, unas cuanlas medidas ffsi- 
cas que emplean los psicdlogos califican para 
escalas de razdn. Por ejemplo, la estatura y el 
peso alcanzan esa calificacidn y quizi tambidn 
algunas medidas fisioldgicas como la respucsta 


Nlvol 


Caracterfsticas 


Permlte 
la categorl- 
zacldn 

Permlte 

laclasifl- 

caclbn 

Ullllia Poses 
Intervalos un punto 
Iguales cero real 

Nominal 

X 




Ordinal 

X 

X 



De Intervalo 

X 

X 

X 


OerazOn 

X 

X 

X 

X 


Figura 4-6. Caracterfsticas esendales de los cuatro ni¬ 
veles de medlcton. 


electrodermica. Pero, en general, lo mis que 
puede esperar un psic61ogo cs una media al ni- 
vel de intervalo. 

Los niveles de medicidn son relevantcs para 
la construccidn de pruebas debido a que los 
procedimientos estadisticos paramdtricos mis 
poderosos y utiles (p. cj., r de Pearson, anilisis 
de varianza, regresidn multiple) deberfan utili- 
zarse solo para puntuacioncs obtenidas de me¬ 
didas que satisfaccn los criterios de las escalas 
de intervalo o de razdn. Para las escalas que 
sdlo son nominales u ordinates deben emplear- 
se procedimientos estadfsticos no paramdtricos 
menos poderosos (p. cj., ji cuadrada, correla- 
cidn por rangos, pruebas de mediana). En la 
prictica, se suponc que la mayor parte de los 
principals instrumentos de examen psicoldgi- 
co (en especial las pruebas de inteligencia y 
escalas de pcrsonalidad) emplean una medicidn 
que de mancra aproximada esti al nivel de in- 
tcrvalo aunque, en tdrminos estrictos, es muy 
diffcil demostrar igualdad absoluta de interva¬ 
los para dichos instrumentos (Bausell, 1986). 
Ahora que el lector se ha familiarizado con los 
niveles de medicidn, se presenta una mucstra 
representativa de los mdtodos de esealamiento, 
senalando de antemano que los diferentes md- 
todos producen distintos niveles de medicidn. 


I METODOS REPRESENTATIVOS 
DE ESCALAMIENTO 


CLASIFICACIONES DE EXPERTOS 

Supdngase que se desea medir la profundidad 
del coma en los pacientes que han sufrido un 
traumatismo crancal recicnte que los ha dejado 
inconscientes. Una escala de profundidad del 
coma serfa muy importante para la prediccidn 
del curso de la mejorfa, debido a que es bien 
conocido que un periodo extenso de inconscien* 
cia ofrece un prondstico pobre de recupctacidn. 
Ademis, el personal de rehabilitacidn tienc la 
necesidad prictica de saber si un paciente esti 
en coma profundo o se encuentra en un estado 








I - 

parcialmente comunicativo dc conciencia con 
jamnolencia. 

Un enfoque de la medicidn con una escala 
de la profundidad del coma consisting en de¬ 
coder de las clasificaciones de expertos en 
cuanto a aspectos conductuales. Por cjcmplo, 
sc |e puedc pedir a un panel de neurdlogos que 
enumere las conductas asociadas con los dife- 
rentes niveles dc conciencia. Dcspuds de que 
&tos han presentado una gran lista dc conductas 
diagndsticas. los autores de la prueba —prefe- 
riblcmente expertos en traumatismos cranea- 
| e s—clasificarfan las conductas indicadorasen 
un continuo dc conciencia que vaya desde el 
coma profundo hasta la orientacidn basica. 
Teasdale y Jennett (1974) utilizaron justo cstc 
enfoque y produjeron la Glasgow Coma Scale 
(Escala de Coma de Glasgow), instrumentos 
sunilares a dste se emplean de mancra amplia 
en hospitales para la evaluaci6n de lesiones por 
traumatismo craneal (figura 4-7). 

La Glasgow Coma Scale se califica al ob- 
servar al paciente y asignarcl miximo nivel de 


Validez y desarrollo de pruebas • 147 


funcionamiento en cada una de las tres subes- 
calas. En cada una sc supone que el paciente 
presenta todos los niveles de conducta por de- 
bajo del nivel calificado. Asf, desde un punto 
de vista psicomdtrico, esta escala consiste de 
tres subescalas (ojos, rcspucsta verbal y res- 
puesta motora) cada una de las cuales produce 
una clasificacidn ordinal de conducta. 

Ademis de las clasificaciones, es posible 
calcular una sola puntuacidn total que se en- 
cuenlra un poco mis alii de una escala ordi¬ 
nal, aunque probablemcntc sea menos que una 
verdadera medicion al nivel de intervalo. Si se 
asignan numeros a las clasificaciones (p. ej., para 
ojos abiertos una codificacidn de “no" = 1; “ante 
el dolor” = 2 y asf sucesivamente), cntonces 
pueden sumarsc los mlmeros para el nivel ca¬ 
lificado en cada subescala, lo cual produce 
una puntuacidn mixima posible de 14 puntos. 
La puntuacidn total en la Glasgow Coma Scale 
predice la recupcracidn posterior con un grado 
muy alto de precisidn (Jennett, Teasdale y Knill- 
Jones, 1975). Por tanto, puede verse que las 


OCTUBRE 


E 

Ojos 

4 EspontSneamente 

S 

abiertos 

3 Ante el tiabla 

2 Ante el dolor 

C 

A 


1 Ninguno 

L 

A 

Major 

SOfientada 


respuesta 

4 Confusa 

D 

verbal 

3 Inapropiada 

2 Incomprensible 

E 


1 Ninguna 

C 


Major 

5 Obedece mstrucciones 

O 

respuesta 

4 Localiza el dolor 

M 

motora 

3 Flexibn ante el dolor 

2 Extension ante el dolor 

A 


1 Ninguna 



Figura 4-7. Ejemplo de la utilizacibn de la Escala de Coma de Glasgow para e< registro de la protundidad del 
coma, 

Fuente: ReproduckJo con autorizaclbn de Jennett, B„ Teasdale, G. M„ and Knill-Jones, R. P. (1975). Predicting 
outcome alter head injury. Journal of the Royal College of Physicians of London, 9. 231-237. 
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pruebas psicolbgicas baslante clcmentales ob- 
tcnidas de los mbtodos de escalamiento mbs 
sencillos pueden, a pesar de ello, proporcionar 
informacion valida y util. 

M^TODO DE INTERVALOS 
DE apario6n BALANCEADA 

A principios de este siglo, L. L. Thurstone 
(1929) propuso un mbtodo para construir esca- 
las al nivel de intervalo a partir de afirmacio- 
nes de actitud. Su mctodu de intervalos de 
nparicibn balanceada todavi'a se utiliza cn la 
actualidad, lo cual hace que Thurstone sea uno 
de los gigantes de la teorfa psicomdtrica. La 
metodologfa en sf para construir intervalos de 
aparicibn balanceada es un tanto estadfsticamcn- 
te compleja y abrumadora, pero la Ibgica sub- 
yacente es fbcil de explicar (Ghiselli, Campbell 
y Zcdeck. 1981). Para ilustrar este mbtodo, se 
resumen los pasos implicados en la construe - 
ci6n de una cscala de actitudes hacia la mem- 
bresfa a una iglesia. 

1. Se obtienen tantas afirmaciones posibles de 
falso-verdadero que reflejen una variedad 
de actitudes positivas y negativas hacia la 
iglesia. Dos ejemplos extremos podrfan scr: 

"Sicnto que los servicios religiosos me dan ins- 
piracibn y me ayudan a dar lo mejor de mi mis- 
mo durante la siguiente semana". 

“Pienso que las iglesias buscan imponcr gran 
cantidad de dogmas anticuados y supersticio- 
nes mcdievales”. 

Por supuesto, tambibn sc reunirfan muchos 
reactivos modcrados. 

2. A continuacibn, se le pide a un numero apro- 
ximado de 10 jueces expertos que califiqucn 
estas afirmaciones para determinar el grado 
de favorabilidad/dcsfavorabilidad hacia la 
actitud. Los jueces deben scrcalificados para 
esa tarca; podrfa utilizarsc a ministros pa¬ 
ra una escala de actitud hacia la membresfa 
a una iglesia. En general, se pide a cada juez 
que clasifique cada afirmacibn en categorfas 
de 1 a 11 que vayan desde “extremadamente 
favorable” hasta "extremadamente desfavo- 


rable”. Se le dice a los jueces que hagan a un 
lado sus propios prejuicios y que conside- 
ren las 11 categorfas como cquidistantes. 

3. Despuds de que los jueces han terminadocon 
el proccso de evaluacibn. sc determina la 
calificacibn media de favorabilidad (de 1 a 
11 ) y la desviacibn estbndar para cada 
reactivo. Por ejemplo, 10 jueces pueden 
haber dado una calificacibn promedio de 
favorabilidad de 9.2 al primer reactivo antes 
enunciado; pero es probable que las cali- 
ficaciones difieran de un juez a otro, como 
se refleja en una desviacibn estbndar de 1.1 
para este reactivo. 

4. Debido a que la desviacibn estbndar cn la 
calificacibn de favorabilidad de un reactivo 
refleja ambigiiedad, los reactivos con desvia- 
ciones estbndar grandes se dcscartan. Por lo 
general, se eligen aproximadamente 20 a 30 
reactivos, de modo que las afirmaciones 
cubran el rango de la dimensibn (favorable 
a desfavorablc). Se suponc que las diferencias 
entre reactivos en la escala final satisfacen 
las propiedades de una escala de intervalo. 

5. Se pide a las personas que contcstcn la escala 
de actitud que marquen todas las afirmacio- 
ncs con las que concuerdan. Su calificacibn 
se determina al promediar los valores de 
escala de los reactivos rcspaldados. 

Ghiselli, Campbell y Zedeck (1981) senalan que 
el metodo de escalamiento anterior tan sblo pro¬ 
duce la escala de actitud. Todavfa se necesitan 
anblisis de la confiabilidad y validez de la escala 
a fin de determinar su idoncidad y utilidad. 

Un estudio de Russo (1994) ilustra una 
aplicacibn moderna del mbtodo de Thurstone. 
Esta autora utilizb un enfoque de escala como 
el de Thurstone para evaluar 216 reactivos de 
tres inventarios dcstacados de autoinforme para 
evaluar depresibn. Los jueces incluyeron a 527 
estudiantes de pregrado y 37 miembros del cuer- 
po docente clfnico de una escucla de medicina. 
Los 216 reactivos se distribuyeron en forma 
aleatori§ y se calificaron con respecto a grave- 
dad dela depresibn desde 1, que representaba 
ausencia de depresibn, hasta 11, que significa- 
ba depresibn extrema. Russo descubrib que los 
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trej inveniarios de autoinforme carecfan de 
ftactivos y opciones de respuesta tfpicos de la 
jepresibn leve. La distribucibn de los 216 
[tactivos fue bimodal, con muchos de ellos 
Bgrupados cerca de la parte baja (ninguna depre¬ 
ss) y muchos otros cerca de la parte media 
(deprcsibn moderada). Una conclusibn carac- 
ten'stica para uno de los conjuntos de reactivos 
de una destacada escala de deprcsibn fue la 
siguiente: 


Calificacibn 

Puntuacibn 

Contenido del 

para la 
dcpresion 

original 

rcactivo 

10 

1 

Nunca me siento 
mclancblico o triste. 

34 

2 

En ocasiones me 
siento melancblico 
o triste. 

4.1 

3 

Me siento melancb- 
licoo triste una buena 
parte del tiempo. 

44 

4 

Me siento melancb¬ 
lico o triste la mayor 
parte del tiempo. 


El lector verb que la calificacibn original de 
estos reactivos se desvfa sustancialmente de las 
calificaciones de dcpresibn que proporcionb el 
panel de estudiantes y doccntes clfnicos. Tam- 
bien es evidente que los valores reales de la 
escala son discontinues, ya que van de 1.0 a 
3.4 y mbs alto. Se observb un patrbn similar 
para muchos de los reactivos cn los tres inven- 
tarios, lo cual condujo a Russo (1994) a con- 
cluir: 

Estos resultados sugieren que si se utiliza la pun- 
tuacion original para las tres escalas que se exa- 
mlnan aqui, entonces las dislinciones entre blen- 
estar y ausencia de depresibn, al igual que entre 
depresibn moderada y grave, serdn dHIciles de 
realizar. Tal ImpreciskJn bard d If fell la evaluacldn 
de la eflcacia de los tratamientos para la depre- 
sibn, debido a que una carencia corno bsta debe 
estar en luncibn de un error adlcional de medl- 
cibn debido a las medldas ordinales. Tal error 
tamblen crearla un desastre en estudios Ion- 
gitudinales, en especial en aquellos en los que 
participa la memoria. 


En este ejcmplo puedc verse que cl enfoque de 
Thurstone para la asignacibn de una escala para 
los reactivos tienc poderosas aplicaciones en el 
desarrollo de pruebas. Con base en estos des- 
cubrimientos, los investigadores estbn ahora en 
posicibn de desarrollar escalas mejoradas de auto- 
informe que evaltien el rango completo de sfn- 
tomas de la depresibn. 

METODO DE E5CALAMIENTO ABSOLUTO 

Thurstone (1925) tambidn desarroll6 el rabto- 
do de escalamiento absoluto, un procedimien- 
to para obtener una medida de la dificultad 
absoluta de los reactivos con base en los resul¬ 
tados de diferentes grupos de personas exami- 
nadas de diferentes edades. La metodologfa para 
determinar la dificultad individual dc los reacti¬ 
vos en un escalamiento absoluto es bastante 
compleja, aunque la fundamentaci6n subyacen- 
le no es tan diffcil de comprender. En esencia, 
se aplica un conjunto de reactivos comuncs de 
prueba a dos o mis grupos dc diferentes eda¬ 
des. La dificultad rclativa de dstos sirve como 
fundamento para realizar una serie de compa- 
racioncs entrelazadas para todos los reactivos 
y todos los grupos por edad. Un grupo por edad 
sirve como grupo base. La dificultad de los 
reactivos se midc en unidades comunes como 
unidadcs de capacidad en desviaci6n estbndar 
para el grupo base. El mbtodo de escalamiento 
absoluto se utiliza ampliamente cn pruebas de 
rendimiento y aptitud (STEP, 1980; Donlon, 
1984). 

Thurstone (1925) ilustrb el mbtodo de es¬ 
calamiento absoluto con datos de prueba de 
3 000 escolares cn las 65 preguntas de la prue¬ 
ba Binet original. Con la media de inteligencia 
de los niflos de 3 nnos, 6 meses de edad en la 
prueba Binet como punto cero y la desviacidn 
estbndar de su inteligencia como unidad de 
medicidn, construy6 una escala que iba de -2 a 
+10 y despubs local iz6 cada una dc las 65 pre¬ 
guntas en esa escala. Thurstone (1925) encon- 
tr6 que la escala “hace surgir de mancra bastante 
sorprendente el hecho de que las preguntas se 
encuentran agrupadas de mancra indebida en 
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cicrtos ranges [de dificullad] y son mis bien 
escasas en otros”. Un autor moderno de prue- 
bas utilizarfa este tipo de analisis como base 
para climinar reach vos redundantes (en el sen- 
tido de que miden el mismo nivel de dificultad) 
y anadirfa otros que analicen los rangos supe- 
riores (e inferiores) de dificultad. 

ESCALAS LIKERT 

Likert (1932) propuso un mltodo sencillo y di- 
recto para asignar una escala a las actitudcs, el 
cual tiene amplia utilizacidn hoy dfa. Una es¬ 
cala Likert Ic presenta a la persona evaluada 
cinco respuestas ordenadas en un continuo de 
acuerdo/desacuerdo o aprobacidn/desaproba- 
cidn. Por ejemplo, un reactivo en una escala 
para evaluar las actitudcs hacia la membresfa a 
una iglesia podrfa sen 

Los servicios rcligiosos me dan inspiracidn y me 
ayudan a dar lo mejor de mf mismo durante la 
siguientesemana. 

Usted csti: 



Fuerte- De Indeciso En desa- Fuertcmen- 
mente acucr- cuerdo teendesa- 

dc do cuerdo 

acucrdo 

Dependicndo del frasco dc un reactivo en par¬ 
ticular, una respuesta extrema de “fuertemente 
de acuerdo" o "fuertemente en desacucrdo" in- 
dicarfa la respuesta mis favorable en la actitud 
subyacente medida con este cueslionario. Likert 
(1932) asignd una puntuacidn de 5 a esta res¬ 
puesta extrema, 1 a la respuestas totalmente 
contraria y 2, 3 y 4 a las respuestas interme- 
dias. La puntuacidn total dc la escala se obtiene 
al sumar las puntuacioncs de los reaclivos indi¬ 
viduates. Por tal razdn, la escala Likert tambidn 
se conocc como escala sumatoria. 

ESCALAS GUTTMAN 

En una escala Guttman, las personas que co- 
rroboran una afirmacion tambicn concuerdan 


con aftrmaciones mas leves que ticnen que 
ver con cl mismo continuo subyacente (Guttman, 
1944,1947). Asf, cuando el examinador cono. 
ce la confirmacidn mis extrema de la persona 
evaluada en el continuo, le es posible recons- 
truir tambidn la respuesta intermedia. Las es- 
calas Guttman se producen al seleccionar 
rcactivos que caigan en una sccucncia ordena- 
da de confirmaciones de la persona examinada. 
Es poco cornu n que sc logre una escala Guttman 
perfects debido a los errorcs de medici6n pero, 
dc todas maneras, es una meta adecuada para 
ciertos tipos de pruebas. 

Aunquc el enfoque Guttman sc disefid ori- 
ginalmente para determinar si un conjunto de 
afirmaciones de actitud es unidimensional, la 
tdcnica se ha utilizado para muchos tipos dife- 
rentes dc pruebas. Por ejemplo. Beck utilizes un 
mdtodo de escalamiento del tipo Guttman para 
producir los reactivos individuates del Beck 
Depression Inventory (Invcntario Beck dc De- 
presidn; BDI, Beck, Steer y Garbin, 1988; Beck 
y colaboradores, 1961). Los reactivos de este 
inventario se parecen a los siguientes: 

( ) En ocasiones me siento triste o afligido 

( ) Con frccuencia me siento triste o afligido 

( ) Me siento triste o afligido la mayor par¬ 
te del tiempo 

( ) Siempre me siento triste y no puedo 
tolerarlo. 

Se pidc al clientc que "marque en cada grupo 
las afirmaciones que, a su parecer, lo represen- 
ten de mancra mis certera". Un cliente que 
marque una altemativa extrema (p. ej., “Siem¬ 
pre me siento triste y no puedo tolerarlo") casi 
con toda seguridad coincided tambidn con las 
afirmaciones mis leves. 

mEtodo DE CONCORD AN CIA 
EMPfefCA 

Es posible que el lector haya observado que la 
mayor parte de los mdtodos de escalamiento que 
se analizan en la seccidn anterior dependen del 
juicio autorizado dc expertos para la seleccidn 
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y ordenaci6n de los reactivos. Tambidn es po- 
sible construir cscalas de medicidn que se ba¬ 
ser! por completo cn consideraciones empfricas 
ajcnas a la teorfa o el juicio experto. En el m£- 
todo de concordancia emp(rica, los reactivos 
de una prueba se seleccionan para una escala 
con base dnicamente en qud tan bien contras- 
lan con un grupo criterio con respecto a una 
muestra normativa. Por ejemplo, se podrfa ob- 
tener una escala de Dcprcsidn a partir de una 
reserva de preguntas de falso-vcrdadero de un 
inventario de pcrsonalidad, como se ve a conti- 
nuacidn: 

1 . Se reune a un grupo cuidadosamente selec- 
cionado y homogdneo de personas que ex- 
peri menten depresidn mayor, a fin de que 
respondan a la reserva de preguntas de falso- 
verdadcro. 

2. En cada reactivo se compare la frecuencia 
de confirmacidn del grupo de depresidn con 
la de la muestra normativa. 

3. Los reactivos que muestran una gran dife- 
rcncia en frecuencia de confirmacidn entrc 
las muestras con dcprcsidn y normativa se se¬ 
leccionan para la escala de Depresidn, se 
codiftcan en la direccidn favorecida por los 
individuos con depresidn (vcrdadero o falso, 
segun sea apropiado). 

4. Entonces, la puntuacidn en bruto de la escala 
de Depresidn es sencillamente el numero de 
reactivos respondidos en la dircccidn codi- 
ficada. 

El mbtodo de concordancia empfrica puede pro- 
ducir algunas sorpresas interesantes. Un des- 
cubrimiento connin es que algunos reactivos 
sdcccionados para una escala pucdcn no mos- 
trar relacidn obvia con el constructo a medir. 
Por ejemplo, un reactivo como “Bebo mucho 
agua” (codificado como vcrdadero) podrfa ter- 
ninar dcntro de una escala de Depresidn. La 
fundamcntacidn momentinea para incluir este 
reactivo es sencillamente que funciona. Por 
supuesto, el reto que se le prcsenta a los inves- 
tigadores consistc cn dcterminar por qud fun¬ 
ciona el reactivo. Sin embargo, desde el punto 


de vista prictico de la construccidn de una 
escala empfrica, las consideraciones tcdricas 
ticnen importancia secundaria. En el tema 14A, 
Inventarios de autoinforme, se analiza con 
mayor amplitud cl mdtodo de concordancia em¬ 
pfrica. 

construco6n de escalamiento 

RACIONAL (CONSISTENQA INTERNA) 

El enfoque racional de la construccidn de una 
escala es un mdtodo popular para el desarrollo 
de los inventarios de autoinforme. El nombre 
racional es en cierto modo equivocado, ya que 
algunos mdtodos cstadfsticos son esenciales 
para este enfoque. Tambidn, el nombre implica 
que otros enfoques no son racionales o son 
irrecionalcs, lo cual es falso. En cl ccntro del 
mitodo de escalamiento racional se encuen- 
tra que todos los reactivos de la escala se 
correlacionan en sentido positi vo entre sf y tam- 
bidn con la puntuacidn total de la misma. Un 
nombre altemativo y mis apropiado para este 
enfoque es el de consistencia interna, el cual 
enfatiza lo que en realidad se hace. Gough y 
Bradley (1992) explican c6mo fue que el enfo¬ 
que racional obtuvo su descriptivo tftulo: 

La ktea de la racional Idad antra en escena en el 
momento en que el tema central o dimension 
uniticadora, alrededor del cual se agrupan los 
reactivos, es aquel que de antemano articulb 
conceptualmente el autor de la medida y a partir 
del cual se determina la calificacibn de cada 
reactivo de manera Ibgtca y comprenslble. 

Se seguiri su presentacidn para ilustrar los as- 
pcctos del enfoque racional. 

Supdngase que un autor de pruebas desea 
desarrollar una nueva escala de autoinforme 
para el potencial de lidcrazgo. Con base en una 
revisidn de la literature pertinente, el investi- 
gador podrfa concluir que el potencial de 
liderazgo se caracteriza por confianza cn uno 
mismo, flexibilidad bajo presi6n, inteligencia 
elevada, capacidad de persuasidn, asertividad 
y la capacidad para percibir lo que otros pien- 
san y sienten. Estos conceptos sugieren que los 
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siguientcs reactivos dc falso-vcrdadero podrfan 
ser utiles en la evaluacidn del potencial de 
liderazgo (Gough y Bradley, 1992): 

• En general tcngo confianza y seguridad cn 
mi' mismo. (V) 

• Cuando otras personas estdn cn dcsacuerdo 
conmigo, en general me quedo en silencio o 
cedo de algun otro modo. (F) 

• Creo que me encuentro notablemente por 
cncima del promcdio en cuanto a capacidad 
intelcctual. (V) 

• Con frecuencia siento que tengo una com- 
prensidn deficientc de la manera en que otras 
personas reaccionardn ante las cosas. (F). 

• Es probable que mis amigos me describieran 
como una persona fuerte y endtgica. (V) 

La V y la F despuds dc cada afirmacidn indi¬ 
can la direccidn codificada de manera racional 
para el potencial de liderazgo. 

Por supuesto, tambien se propondrfan 
reactivos adicionales con intenciones similarcs. 
D autor de la prueba podn'a comenzar con 100 
reactivos que parecen —con una base racio¬ 
nal— evaluar el potencial de liderazgo. Estos 
reactivos preliminarcs se aplicarfan a una mues- 
tra amplia dc individuos similares a la pobla- 
ci6n bianco a la que se dirige la escala. Por 
ejemplo, si dsta sc disefia para identificar a es- 
tudiantes universitarioscon potencial de lideraz¬ 
go, entonces deberfa aplicarse a una muestra 
reprcscntativa de varios cientos de estudiantes 
universitarios. Para el desarrollo de la escala 
son deseables muestras muy grandcs. En este 
caso hipotdtico, supdngase que se obtienen re- 
sultados con 500 estudiantes universitarios. 

El siguiente paso en la construccidn de un 
escalamiento racional consiste en correlacionar 
las puntuaciones de cada uno de los reactivos 
preliminarcs con la puntuacidn total dc la prue¬ 
ba para los 500 participantes cn la muestra del 
piloteo. Debido a que las puntuaciones en los 
reactivos son dicotdmicas (se asigna dc manera 
arbitraria un 1 para la respuesta que correspon- 
de a la clave de calificacidn y 0 a la alternati va), 
se requiere dc un coeficiente r* *. de correlaci6n 
biserial. Una vez que se obtienen las correla- 


ciones, el investigador busca en el listado la s 
correlaciones ddbilcs y las inversas (correlacio- 
nes negativas). Estos reactivos se descartan 
debido a que no contribuycn a la medicidn del 
potencial de liderazgo. Podrfan eliminarse has- 
ta la mitad de los reactivos originates. Si de ini- 
cio se dcscarta una gran proporcidn de dstos, el 
investigador podrfa volver a calcular las corre¬ 
laciones entre los reactivos y cl total, con base 
en una reserva rcducida de aqudllos para veri- 
ficar la homogeneidad de los restantes. Los 
reactivos que sobreviven a este procedimiento 
iterativo constituyen la escala de potencial de 
liderazgo. El lector deberfa mantener en mente 
que el enfoque racional para la construccidn de 
escalas tan s6lo produce una homogdnea al 
medir un constructo especificado. Se necesita- 
rfan estudios adicionales con nuevas muestras 
de individuos para deierminar la confiabilidad 
y validez de la nueva escala. 

1 CONSTRUCOdN DE REACTIVOS 


Construir los reactivos de una prueba es un pro¬ 
cedimiento doloroso y laborioso que impone 
demandas a la creatividad de los autores de 
pruebas. Quien los redacta se enfrenta con una 
profusion dc preguntas iniciales: 

• £EI contenido de los reactivos debe ser ho- 
mogdneo o variado? 

• iQud rango de dificultad deberfan cubrir los 
reactivos? 

• ^Cudntos reactivos iniciales deberfan cons- 
fruirse? 

• iQud procesos cognitivos y dominios del 
reactivo deberfan cubrirse? 

• iQu6 tipos dc reactivos dc prueba deberfan 
utilizarse? 

Se atenderd de manera breve a las ties prime- 
ras preguntas antes de volver a un andlisis 
mds detallado de los dos ultimos temas, que 
por lo comun se engloban bajo los encabeza- 
dos de tabla de especificaciones y formatos de 
reactivo. 
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ptfGUNTAS INICIALES 

eN construcci6n de pruebas 

primera pregunta tiene que ver con la ho- 
^gencidad contra la heterogeneidad en el con- 
icnido de los reactivos de una prueba. En gran 
medida. aqucllo quc dicta si cl contenido de los 
reactivos ha de ser homogdnco o variado es la 
ml incra en que el autor de la prueba ha defini- 
doal nuevo instrumento. Consideresc una prue- 
b fl culturalmente reducida de la inteligencia 
general. Dicho instrumento podrfa incorporar 
reactivos variados, en tanto las preguntas no 
stipongan una cscolaridad espccifica. El autor 
de la prueba podrfa tener la intencidn de in¬ 
corporar problemas novedosos que sean igual- 
mente desconocidos para todas las personas 
evaluadas. Por otro lado, con una prueba de pen- 
samiento espacial que se base en la teorfa, se 
requerirfan subescalas con reactivos que ten- 
gan contenido homogdneo. 

El rango de dificultad de los reactivos debe 
ser el suficicnte como para dar lugar a una di- 
ferenciacidn significativa de las personas eva¬ 
luadas en ambos extremos. Entonces, las 
pruebas mds utiles son aqucllas que incluyen 
una serie graduada de reactivos muy fdcilcs, 
que aprueban casi todos, al igual quc un grupo 
de dstos cada vez mds diffeiles quc casi nadie 
aprueba. Se observa un efecto de lfmite supe¬ 
rior cuando numeros significativos de exami- 
nandos obtienen puntuaciones pcrfcctas o casi 
perfcctas. El problema con el efecto de lfmite 
superior cs que no son posibles las distinciones 
enlre personas con puntuaciones clevadas, aun- 
queestos individuos podrfan diferir de mancra 
sustancial en cuanto al rasgo subyacente que 
mide la prueba. Se observa un efecto de lfmite 
inferior cuando cantidades significativas dc 
exammandos obtienen puntuaciones que sc cn- 
cuentran cerca o en la parte mds baja de la cs- 
cala. Porejemplo, el WAIS-R tiene un importante 
efecto de lfmite inferior cn cuanto a que no 
puede discriminar entre los nivcles moderado, 
grave y profundo de retraso mental —todas 
It'S personas con discapacidadcs significativas 
del desanollo fallan en sus respucstas a casi 
•odas las preguntas. 


Los autores de pruebas esperan que algu- 
nos de los reactivos iniciales produzcan contri- 
bucioncs poco eficaces para el objetivo global 
de medicidn de su instrumento. Por esta razon, 
es comun la prdctica de construir un primer 
borrador que contenga un exccso dc reactivos, 
quizds cl doblc del numcro dc preguntas quc se 
dcsecn para el bosquejo final. Por ejemplo, el 
MMPI, que conticne 550 reactivos, original- 
mentc consistfa de mds de 1 000 afirmaciones 
de falso-verdadero acerca de la personalidad 
(Hathaway y McKinley, 1940). 


TABLA DE ESPEdFICACIONES 

Es frecucnte que los autores profesionales de 
pruebas de rcndimiento y capacidad utilicen uno 
o mds esquemas de rcdaccidn de reactivos para 
ayudar a garantizar quc su instmmento dctccte 
una mezeia deseada de procesos cognitivos y 
dominios dc contenido. Por ejemplo, un esque- 
ma muy sencillo de redaccidn de reactivos po¬ 
drfa cstableccr que una prueba dc rendimiento 
sobre la Guerra Civil de los Estados Unidos 
deberfa consistir de 10 reactivos de opcidn 
multiple y 10 preguntas de llenado de espacios 
en bianco, la initad de ellos sobre cuestiones 
objetivas (p. ej., fechas, principalcs batallas) y 
la otra mi tad sobre asuntos conceptuales (p. ej., 
diferentes perspectivas acerca de la esclavitud). 

Antes dc que comicnce el desarrollo de la 
prueba, por lo general los redactores de los 
reactivos reciben una tabla de especificacio- 
nes. fist a enumera la informacidn y las tareas 
cognitivas en las quc se ha de evaluar a los 
examinandos. Quizds la tabla mds comun sea 
la matriz de contenido por proceso, que lista el 
numero exacto de reactivos en las drcas perti- 
nentes de contenido y dctalla la combinacidn 
precisa de reactivos que deben ejemplificar 
diferentes procesos cognitivos (Millman y 
Greene, 1989). 

Considdrese una prueba de rcndimiento en 
ciencias naturales adecuada para estudiantes dc 
educacidn media. Dicha prueba deberfa cubrir 
muchns dreas diferentes de contenido y debe¬ 
rfa requerir una mezeia de procesos cognitivos 
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Cuadro 4-6. Ejemplo de una tabla 
de especiflcaciones de contenido 
por proceso para una prueba hipotetica 
de rendimiento en ciencias naturales 
con 100 reactivos 




Proceso 


Area 

Conoci- 

Suflciencia 

Razona- 

de conte- 

miento 

de la 

miento 

nido 

objetivo' 

informaci6n t 

infe- 

rencial* 

Astronomla 

B 

3 

3 

Botanica 

6 

7 

2 

Quimica 

10 

5 

4 

Qeologia 

10 

5 

2 

Flslca 

8 

5 

6 

Zootogia 

8 

5 

3 

Totales 

50 

30 

20 


' Conocimlenlo objetivo los reactivos pueden responderse con 
base en el simple reconocimicnlo de hechos bds*cos 
' Sutidenda de la InlormaoOn los reactivos requieren del empleo 
de intormacidn proporcionada en el texto escrito 
1 Razonamionlo inlerendal: los reactivos pueden responderse 
haciendo deduccioncs u obteniendo conclusiones 

quc vayan desdc el recuerdo simple hasta el 
razonamiento inferencial. A1 proporcionar una 
tabla de especiflcaciones previa a la etapa de 
redaccidn de reactivos, el autor de la prueba 
pucdc garantizar que el instrument) resultantc 
contenga un equiiibrio apropiado en cuanto a 
cobertura de temas y que dctecta un rango de- 
seado de habilidades cognitivas. En el cuadro 
4-6 sc prescnta una tabla de especiflcaciones 
hipotdtica, pero realista. 

FORMATOS DE LOS REACTIVOS 

En lo que se refiere al mdtodo a travds del cual 
se han de evaluar los atributos psicoldgicos, el 
autor de prucbas se enfrenta a docenas de opcio- 
nes. De hecho, seria fdcil escribir un capitulo 
completo solo sobre este tema. Para una resena 
sobre formatos de reactivos, el lector interesa- 
do deberia consultar a Bausell (1986), Jensen 
(1980) y Wesman (1971). En esta seccion se 
revisardn de manera rapida las ventajas e in- 


convenientes de las varicdades m&s comuncj 
de reactivos de una prueba. 

En el caso de prucbas de aplicacidn grupa] 
sobre intelecto y rendimiento, la tlcnica a ele- 
gir es la de pregunlas de opci6n multiple. Por 
ejemplo, un reactivo en una prueba de rendi- 
miento sobre historia cstadounidense podrfa 
incluir esta combinacidn de planteamiento y 
opciones: 

El presidente de Estados Unidos durante la 
Guerra Civil fue: 

a. Washington. 

b. Lincoln. 

c. Hamilton. 

d. Wilson. 

Los defensorcs de la metodologfa de opcitSn 
multiple afirman que los reactivos construidos 
de manera apropiada pueden medir tanto el co- 
nocimicnto conceptual como el objetivo. Las 
pruebas de opci6n multiple tambidn permiten 
la calificacidn mecanica riipida y objetiva. Lo 
que es mis, la equidad de las preguntas de op- 
ci6n multiple se pucdc probar (jo en ocasiones 
refutar!) con los procedimientos muy sencillos 
de anilisis de reactivos que se analizan poste- 
riormcnte. Las principales desventajas de las 
preguntas de opcidn multiple son, en primer 
lugar, la dificultad de escribir buenas opciones 
distracloras y, en segundo, la posibilidad de que 
la presencia de la respuesta pueda darle un in- 
dicio de la contcstacidn correcta a una persona 
con un conocimiento vago. Las pautas para la 
redaccidn de buenos reactivos de opcidn mul¬ 
tiple se listan en el cuadro 4-7. 

Los mdtodos de correspondencias son po- 
pulares en el saldn de clases, pero sufrcn de 
graves desventajas psicomdtricas. Un ejemplo 
de correspondencias es: 

Utilice las letras que aparecen del lado izquierdo 
para establecer la correspondencia entre cl nombre 
y la obra alcanzada: 

A. Binct _tradujo una de las principales 

prucbas de inteligencia. 












Valldez y desarrollo de pruebas • 155 



Cuadro 4-7. Pautas para la redaccidn 
de reactivos de opci6n multiple 

Elija palabras que tengan significados precisos. 

Evite la sinlaxis compleja o extrarta. 

Incluya loda la intormacibn necesaria para la selec- 
cion de la respuesta. 

Incluya lo mas posible de la pregunta dentro del plan- 
tea m lento. 

No tome los planteamienlos al pie de la lelra de los 
llbros de lexto. 

gtillco opctones de Iguai extension y (raseo paralelo. 

Utillce ‘ninguna de las anteriores" y "todas las ante¬ 
riores' en raras ocasiones. 

Reduzca al mfnlmo el ompleo de negativos como no. 

Evlte la utllizacibn de palabras no funcionales. 

Evite la especlflcidad innecesarla en el plantea- 
miento. 

Evite Indicios Innecesarios de la respuesta corrects. 

Presento los reactivos a otras personas para es- 
crutimo editorial. 


B. Woodworth _ninguna corrclacibn cn- 

trc calificaciones y prue¬ 
bas mcntales. 

C. Cattell desarrollo un invcntario 

de personalidad de fal- 
so-vcrdadero. 

D. McKinley _batcria de pruebas sen- 

soriomotoras. 

E. Wisslcr _desarrollo la primerapme- 

ba util de inteligencia. 

F. Goddard _prueba de deteccibn del 

trastorno emocional. 

El problems m3s grave con las corrcspondcn- 
cias es que las respuestas no son independen¬ 
ts —en general, si el examinando pierde una 
correspondence, esto lo obliga a fallar en otra. 
Olro problema es que las opcioncs en una co¬ 
rrespondencia deben relacionarse de manera 
wtrecha o la pregunta serd demasiado fbcil. 

Cuando se trata de pruebas aplicadas dc 
■rianera individual, el procedimiento a elegir es el 


reactivo objetivo con respuesta corta. De hecho, 
es frecuente que los tipos mSs sencillos y direc- 
tos de preguntas posean la mejor confiabilidad 
y validez. Un caso especffico es la subprueba 
de Vocabulario del WAIS-I1I, que consiste sblo de 
pedirle a la persona evaluada que defina pala¬ 
bras. £sta tiene una confiabilidad muy elevada 
(.96) y en general se considers como la mejor 
medida individual de la inteligencia general en el 
WAIS-III (Gregory, 1999). 

Con frecuencia, las pruebas de personali¬ 
dad utilizan preguntas de falso-verdadero dc- 
bido a que son fSciles de comprender para los 
individuos. A la mayorfa de las personas les 
resulta sencillo responder con verdadero o fal- 
so a reactivos como: 

V F 

_Me gustan las revistas deportivas. 

Los criticos de este enfoque ban senalado que 
las respuestas a dichas preguntas pueden refle- 
jar la deseabilidad social mds que los rasgos de 
personalidad (Edwards, 1961). Un formato 
alternativo para contrarrestar este problema cs 
la metodologfa de eleccidn forzada, donde la 
persona evaluada debc elegir entre dos opcio- 
nes igualmente descablcs (o indcseablcs): 

Cudl de cstas opcioncs preferirla hacer: 

_ Limpiar un galdn dc jarabe del piso. 

_Trabajar como voluntario por medio dia en 

un asilo de ancianos. 

Aunque el enfoque de elecci6n forzada tiene 
muchas propiedades psicomdtricas (Zavala, 
1965), los autores de pruebas dc personalidad 
no se han lanzado a elegir esta interesante mc- 
todologfa. 

Si EXAMEN DE REACTIVOS 


Los psiedmetras saben que numerosos reactivos 
dc prueba de la reserva original del piloteo se 
descartardn o revisardn a medida que se prosi- 
ga con el desarrollo de la prueba. Por tal razdn, 
los autores producen inicialmente muchos 
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rcactivos adicionales, quizes el doble de los que 
pretendcn utilizar. Asf quc ^cdrno se selcccio- 
na la muestra final de rcactivos de una prucba a 
partir de la reserva inicial de dstos? Los auto- 
res de pruebas utilizan el andlisis de reactivos, 
una familia de procedimientos estadfsticos, para 
idenlificar los mejores. En general, el propdsi- 
to del an&lisis de reactivos consiste cn determi- 
nar curies de ellos se conscrvardn, curies se 
revisardn y curies se climinarfin. Cuando se rea- 
liza un andlisis dctallado de los reactivos. el 
autor podrfa utilizar un fndicede dificultad, uno 
de confiabilidad. uno de validcz, una curva 
reactivo-caracterfstica o un fndice de discri- 
minacidn de los reactivos. En este punto hay 
quc volver la atcncidn hacia una breve revisidn 
de estos enfoqucs estadfsticos para el andlisis de 
reactivos. Los lectores quc dcseen una discu- 
si6n y crftica a profundidad sobre estos temas 
deberfan consultar a Hambleton (1989) y 
Nunnally (1978). 

INDICT DE DIRCULTAD DEL REACT1VO 

La dificultad del reactivo para un solo reactivo 
de prueba sc define como la proporcidn de per¬ 
sonas examinadas en una muestra considera¬ 
ble de piloteo que responden correctamente 
dstc. En cualquier reactivo individual /, cl fn¬ 
dice de dificultad del reactivo es p,. quc varfa 
de 0.0 a 1.0. Un reactivo con dificultad de .2 cs 
mds complicado que uno con una dificultad de 
.7, debido a que son menos las personas que lo 
respondieron de manera correcta. 

El fndice de dificultad del reactivo cs una 
herramienta util para identificar a aquellos que de¬ 
berfan alterarse o descartarse. Supdngase que 
un reactivo tiene un fndice de dificultad cerca- 
no a 0.0, lo cual significa quc casi todos lo han 
respondido de manera incorrecta. Por desgra- 
cia, este reactivo es improductivo en sentido 
psicomdtrico debido a que no proporciona in- 
formacidn acerca de las difcrencias entre per¬ 
sonas examinadas. Para la mayor parte de las 
aplicaciones, el reactivo deberfa volver a redac- 
tarse o eliminarse. Lo mismo pucdc dccirse de 
uno con fndice de dificultad ccrcano a 1.0, donde 


casi todos los participantes dieron la rcspuesta 
correcta. 

^Cudl es el nivel 6ptimo de dificultad del 
reactivo? En general, las dificultades de reactivo 
que giran alrededor de .5, con un rango entre .3 
y .7, aumcntan al mdximo la informacidn que la 
prueba proporciona acerca de las diferencias 
entre personas evaluadas. No obstante, csta re¬ 
gia empfrica cstd sometida a una salvedad im- 
portante y a una excepcidn muy significativa. 

En el caso de reactivos de vcrdadero-falso 
o de opcion multiple, cl nivel dptimo de dificul¬ 
tad del reactivo necesita ajustarse con relacidn 
a los efectos de las conjeluras. En cl caso de 
una prueba de verdadero-falso, se puede obte- 
ncr un nivel de dificultad de .5 cuando los 
examinandos simplemente adivinan la respues- 
ta. Asf, el nivel dptimo de dificultad de dichos 
reactivos deberfa ser de .75 (a la mitad entre .5 
y 1.0). En general, el nivel dptimo de dificultad 
del reactivo se puede calcular con la fdrmula 
(1.0 + c)/2 donde c se refiere al nivel de dxito 
aleatorio. Asf, para una prueba de cuatro 
reactivos de opcidn multiple, el nivel de dxito 
aleatorio cs de .25 y el nivel dptimo de dificul¬ 
tad del reactivo serfa (1.0 + .25)/2 o aproxima- 
damente .63. 

Si sc ha de utilizar una prueba para selcc- 
cionar a un grupo extremo por medio de una 
puntuacidn de corte, puede ser deseablc la se- 
leccidn de reactivos con niveles de dificultad 
fuera del rango de .3 a .7. Por ejemplo, una 
prueba quc se emplee para seleccionar a estu- 
diantes de posgrado para una universidad que 
sdlo acepta a unos cuantos elegidos de entre 
sus muchos solicitantes, deberfa contener mu- 
chos reactivos muy diffeiles. Una prueba que 
se utilicc para asignar a niiios a un programs de 
rcgularizacidn educativa deberfa contener mu¬ 
chos reactivos sumamente fficiles. En ambos 
casos, habrd una discriminaci6n util entre las 
personas examinadas cerca de la puntuacidn 
de corte —una puntuacidn muy alia para las 
admisioncs al posgrado y muy baja para los 
estudiantes elegibles para rcgularizacidn— pero 
poca discriminacidn entre las individuos res- 
tantes (Allen y Yen, 1979). 
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INDICE DE LA CONFIABIUDAD 
DEL REACTTVO 

Dn auior de pruebas puede desear un instru- 
menio que lenga un alto nivel de consistencia 
interna, cn el que los reactivos scan razonablc- 
mente homogeneos. Una manera sericilla de 
determinar si un reactivo individual “se lleva” 
con los rcstantes en la prueba consiste en 
corrclacionar las puntuaciones obtenidas en ese 
reactivo con aqudllas de la prueba complcta. 
Sin embargo, por lo comun los reactivos indi- 
viduales son corrcctos o incorrectos (a menu- 
do se les califica con I o 0), mientras que las 
puntuaciones totales constituyen una variable 
continua. A fin dc corrclacionar estos dos tipos 
diferentes de puntuaciones, cs necesario utili- 
zar un tipo especial de mdtodo cstadistico de- 
nominado coetlciente de correlation biserial 
de puntos. La formula para el cdlculo de estc 
coeficicntc de correlation cs equivalente a la r 
de Pearson que se analizO antes y el coeficiente 
de correlation biserial de puntos trasmite en 
mucho el mismo tipo de information conccr- 
niente a la relation enlre dos variables (una de 
las cuales casualmente cs dicotOmica y se cali¬ 
fica con 0 o 1). En general, entre mds alta sea 
la correlation biserial de puntos r T entre un 
reactivo individual y la puntuaciOn total, mds 
dtil serd <Sste desde la perspectiva dc la consis¬ 
tencia interna. 

La utilidad dc un reactivo dicotOmico de 
una prueba tambidn sc determina por el grado 
en que las puntuaciones obtenidas en 01 sc dis- 
tribuyen entre los dos resultados de 0 y 1. Aun- 
que suena incongruentc, cs posiblc calcular la 
desviaciOn estdndar para reactivos dicotOmicos; 
como ocurre con una variable con puntuaciOn 
continua, la desviaciOn estdndar de un reactivo 
dicotOmico indica el grado dc dispcrsiOn de las 
puntuaciones. Si un reactivo individual tiene 
una desviaciOn estdndar de cero, todos los in- 
dividuos estdn obteniendo la misma puntuaciOn 
(todos correctos o todos incorrectos). Entre mds 
se accrque el reactivo a una division de 50-50 
de puntuaciones corrcctas c incorrectas, mayor 
serd la desviaciOn estdndar. En general, entre 
mds grande sea la desviaciOn estdndar de un 


reactivo, mds util es este para la escala comple- 
la. Aunque no se proporcionard la derivation, 
se puede demostrar que la desviaciOn estdndar 
de la puntuaciOn del reactivo, s„ para un reactivo 
con calificaciOn dicotdmica puede calcular- 
se con la fOrmula: 

S r m yjPr(l-Pl) 

Puede resumirse el andlisis realizado hasta este 
momento del siguiente modo: cl valor poten- 
cial de un reactivo de prueba calificado de ma¬ 
nera dicotdmica depende conjuntamente de su 
consistencia interna, como se indica por el (n- 
dice obtenido de la correlacidn con la punlua- 
cidn total (r rJ ), y tambiOn dc su variabilidad 
segun el (ndice obtenido de su dcsviacidn 
estdndar (s r ). Si se calcula el producto de estos 
dos indices, sc obticne s r r rV que es el (ndice de 
confiabilidad del reactivo. Considdrense las 
caracterfsticas de un reactivo que posee un fn- 
dice relati vamente grande dc confiabilidad. £ste 
exhibirfa fuerte consistencia interna y produci- 
rfa una buena dispersion de puntuaciones entre 
sus dos altcmativas. El valor de este (ndice en 
la construction de pruebas es, dicho de mane¬ 
ra sencilla, el siguiente: al calcular el (ndice de 
confiabilidad de todos los reactivos en la prue¬ 
ba preliminar, pueden climinarse los “mds ex- 
temos” que tienen el menor valor en estc (ndice. 
Dichos reactivos poseerian una consistencia 
interna muy baja o dispersiOn de puntuaciones 
ddbil y, por tanto, no contribuirfan a los objeti- 
vos de la mediciOn. 

INDICE DE LA VALIDEZ DEL REACTIVO 

En muchas aplicacioncs, es importante que una 
prueba posea una validez concurrente o 
predictiva mds elevada posible. En estos casos, 
una pregunta preponderante que gobierna la 
construction de pruebas es: ^cudnto contribu- 
ye cada reactivo preliminar dc una prueba a la 
prediction precisa del critcrio? El (ndice de 
validez del reactivo es una herramienta util en 
la bOsqueda dc los psicOmetras por identificar 
reactivos de una prueba que scan utiles en tdrminos 
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predictivos. Mediante el cAlculo del fndice de 
validez de cada reactivo cn la prueba preliminar, 
cl autor puede idenlificar aquellos que son in- 
eficaces, eliminarlos o volver a redactarlos, y 
producir un instrumento revisado que tenga 
mayor utilidad pr£ctica. 

El primer paso para establecer el fndice dc 
validez de un reactivo consistc cn calcular la 
correlacidn biserial de puntos entre la pun- 
tuacidn del reactivo y aquella en la variable de 
criterio. En general, entre mSs alta sea la corre- 
lacion biserial de puntos r,<-entre las puntuacio- 
nes del reactivo individual y del criterio, mds 
util serd cl reactivo desde el punto de vista de 
la validez predictiva. Como sc senald antes, la 
utilidad de un reactivo tambidn depende de su 
desviacidn cstdndar s r . Asf, el fndice de validez 
del reactivo consistc del producto entre la des- 
viacidn estdndary lacorrelacibn biserial de pun¬ 
tos: .is*. 

CURVAS REACTIVO-CARACTERfSTICA 

Una curva react ivo-caracterfstlea (CRC) es una 
rcpresentacidn grdfica dc la relacidn entre la 
probabilidad de una respucsta correcta y la po- 
sicidn de la persona evaluada en el rasgo sub- 
yaccnte que mide la prueba. No obstante, no se 
tiene acceso directo a los rasgos subyacentes, 
de modo que deben utilizarse las puntuaciones 
observadas para estimar las cantidadcs del rasgo. 

Sc traza una CRC independiente para cada 
reactivo, con base en una grdfica de las pun¬ 
tuaciones totales dc una prueba en el eje hori¬ 
zontal contra la proporcidn de personas que 
aprueban cl reactivo en el eje vertical (figura 
4-8). De hecho, una CRC es una idealizacidn 
matcmdtica de la relacidn entre la probabilidad 
de una respucsta correcta y la cantidad del ras¬ 
go que poseen aquellos que responden a la 
prueba. Diferentes modclos de CRC utilizan di- 
versas funciones matemdticas con base en las 
suposiciones iniciales. El modelo mds sencillo 
dc CRC es el dc Rasch, que se basa en la teoria de 
respuesta al reactivo del matcmdtico danes Georg 
Rasch (1966). El modelo de Rasch es el rods sen¬ 
cillo pot que realiza sdlo dos suposiciones: 1 ) los 


reactivos de prueba son unidimensionalcs y 
miden un rasgo comtin y 2 ) los reactivos de 
prueba varfan en un continuo de nivcl de difj. 
cultad. 

En general, un buen reactivo tiene una CRC 
con una pendiente positiva. Si lacapacidad para 
resolver un reactivo en particular se distribuyc 
de mancra normal, la CRC se asemejard a una 
ojiva normal (curva a cn la figura 4-8). £su 
es, simplcmente, la distribucidn normal traza- 
da en forma acumulativa. 

La forma deseada de la CRC depende del 
propdsito dc la prueba. Los puristas de la 
psicometrfa preferirfan que la CRC del reactivo 
de una prueba se aproximara a la ojiva normal, 
porque esta curva es convenientc para hacer 
deducciones matcmdticas acerca del rasgo sub- 
yacente (Lord y Novick, 1968). Sin embargo, 
para decisiones de seleccidn que se basan en 
puntuaciones de corte, se prcfierc una funcidn 
escalonada. Por ejemplo, cuando sc combina 
con otros reactivos similares, el reactivo que 
produjo la curva b cn la figura 4-8 serfa el mejor 
para seleccionar individuos con altos niveles 
del rasgo medido. 

Las CRC son especialmcntc utiles para 
idenlificar reactivos que tienen un desempefio 
diferente en los subgrupos de personas exami- 
nadas (Allen y Yen, 1979). Por ejemplo, un 
autor de pruebas puede descubrir que un reac¬ 
tivo tiene un desempeho diferente en varones y 
mujeres. £se podrfa ser el caso dc una pregun- 
ta parcial cn cuanto a gdnero que implique 



Nivel de capacidad 


Figura 4-8. Algunos ojemplos de curvas reaclivo-ca- 
racteristica. 
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(jaios sobre ftStbol. Para los varoncs, la CRC en 
—te reactivo podrfa tener la pendiente positiva 
jeseada, mientras que para mujeres dsta podrfa 
$er plana (como la curva c cn la figura 4-8). 
Los reactivos con CRC quc dificrcn cntre sub- 
gnipos dc personas evaluadas deben revisarse 
oeliminarse. 

La teorfa subyacente de la CRC tambidn 
seconoce como teorfa de respuesta al reactivo 
y teorfa dc rasgo latente. Nunnally (1978) ha 
cuestionado la utilidad de este enfoque al seha- 
larque la suposicidn dc unidimcnsionalidad de 
la prueba (implfcita en la CRC que represent 
grdficamcnte el porcentaje que aprueba contra 
el eje horizontal unidimcnsional del valor del 
rasgo) se viola cuando se consideran muchas 
pruebas psicoldgicas. Si no hubicra scrios pro- 
blemas tdcnicos y practices, “uno se pregunta 
por qud no se ha adoptado desde hace largo 
tiempo la teorfa de la CRC para la construcci6n 
y calificacidn dc pmebas” (Nunnally, 1978). 

Los mdritos del enfoque dc la CRC toda- 
vfase discuten. La teorfa de la CRC parece par- 
ticularmente apropiada para ciertos tipos de 
pmebas adaptativas porcomputadora (PAC) en 
las que la persona responde a un conjunto 
individualizndo y unico de reactivos que se ca- 
lifican entonccs en una eseala uniforme subya- 
cente (Weiss, 1983). El enfoque dc las PAC para 
la evaluacion no serfa posible en ausencia dc 
los mdtodos de CRC para la medicidn. Las PAC 
se analizan en el tema ISA, Evaluacidn por 
computadora y el futuro dc las pruebas. Los 
lectorcs que deseen un andlisis mds detallado 
de la CRC y de otros modelos de rasgo latente 
deberfan consultar a Anastasi (1988), Hamblcton 
(1989) y Wright y Stone (1979). 

iNOICE DE DISCRIMINA06N 

del reactivo 

A partir del andlisis de las CRC, deberfa quedar 
claro quc un reactivo de prueba eficaz es aquel 
que discrimina entre los individuos con pun- 
iuaciones alias y bajas en la prueba completa. 
Un reactivo ideal de una prueba cs cl que aprue¬ 
ba a la mayorfa de las personas con alias pun- 


tuacioncs y falla con la mayorfa de los que tie- 
nen bajas puntuaciones (vdase curva a en la 
figura 4-8). La simple inspcccidn visual de 
la CRC proporciona una base rudimentaria para 
estimar la capacidad de discriminacidn de un 
reactivo de una prueba: si la pendiente de la 
curva es positiva y, de preferencia, tiene forma 
de ojiva, el reactivo estd hacicndo un buen tra- 
bajo en cuanto a separar a las personas con pun¬ 
tuaciones altas y bajas. Pert) la inspeccidn visual 
no es un procedimiento totalmente objetivo; lo 
que se requiere es una herramienta estadfsti- 
ca que resuma el poder dc discriminacidn de 
los reactivos individuales de una prueba. 

Un fndice de discriminacidn del reactivo 
es un fndice estadfstico de la eficiencia con la 
que un reactivo discrimina entre personas que 
obtienen altas y bajas puntuaciones cn la prue¬ 
ba completa. Existen muchos indices de dis¬ 
criminacidn del reactivo, que incluyen medidas 
indirectas como la r rT , la correlacidn biserial de 
puntos entre las puntuaciones cn un reactivo 
individual y la puntuacidn total en la prueba. 
No obstante, aquf sc rcstringird cl examen a una 
medida directa, el fndice de discriminacidn del 
reactivo, quc se simboliza por la Ictra minuscu- 
la d, escrita en cursivas. En una base de reactivo 
por reactivo, este fndice compara cl desempe- 
rio dc los participantes cn las regiones superior 
e inferior de la puntuacidn total de prueba. En 
general, los rangos superior e inferior se defi- 
nen como el 10 a 33% de personas dentro de la 
muestra con puntuaciones mds altas y mds ba¬ 
jas. Si las puntuaciones totales de la prueba tie- 
nen una distribucidn normal, la comparacidn 
optima es entre 27%, de personas con puntua¬ 
ciones mds altas y 27% con puntuaciones mds 
bajas. Si la distribucidn de las puntuaciones 
totales de una prueba es mds plana quc la curva 
normal, el porcentaje dptimo es mds grande, 
cercano a 33%. En el caso de la mayor parte de 
las aplicaciones, cualquier porcentaje entre 
25 y 33% producird estimados similares de d 
(Allen y Yen, 1979). 

El fndice de discriminacidn del reactivo 
para un reactivo de prueba se calcula con la 
fdrmula: 

d = (S-iyN 
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donde S es el ndmero de personas evaluadas 
que se cncucntran en el rango superior y que 
respondieron de manera corrccta al reactivo, / 
es el numero de personas evaluadas que estbn 
del rango inferior y que respondieron al reactivo 
en forma corrects y N es el numero total de 
personas evaluadas en los rangos superior o in¬ 
ferior. 

Ilustre el cblculo y empleo de d con un 
ejemplo hipotbtico. Supbngase que un autor de 
pruebas ha construido una versibn preliminar 
de una prueba de rendimiento de opci6n multi¬ 
ple y ha aplicado el examen a una muestra de 
piloteo de 400 alumnos de secundaria. Despuds 
de calcular las puntuaciones totales de cada 
individuo, el autor identifica a 25% con pun¬ 
tuaciones mds alias y a 25% con puntuaciones 
m^s bajas dentro de la muestra. Dado que hay 
100 alumnos en cada grupo (25% de 400), en 
la fbrmula anterior N serd 100. A continuacibn, 
el autor determina el numero de estudiantes en 
los rangos superior e inferior que respondieron 
a cada reactivo de manera correcla. El cblculo 
de d para cada uno se reduce simplemente a 
sustituir estos valores dentro de la fbrmula 
(S-f)IN. Por ejemplo, supbngase que en el pri¬ 
mer reactivo 49 alumnos en cl rango superior 
respondieron de manera corrccta, mientras que 
23 del rango inferior lo hicieron correctamen- 
tc. En este reactivo, d es igual a (49-23)/100 
o .26. 

De la fbrmula para d es evidente que este 
fndicc puede variar de -1.0 a +1.0. Vdase tam- 
bi6n que un valor negativo en de s serial de alar- 
ma de que un reactivo de prueba necesita 
revisibn o sustitucibn. Despues de todo, dicho 


resultado indicarfa que fueron mis los indivi- 
duos con bajas puntuaciones quienes respon. 
dieron de manera correcta al reactivo q Ue 
aqubllos con alias puntuaciones. Si des igual a 
cero, hay un numero exactamente igual de in. 
di viduos con bajas y alias puntuaciones que res- 
pondicron de manera corrccta al reactivo; dado 
que bste no discrimina en absoluto entre perso- 
nas con alias y bajas puntuaciones, entonceg 
deberfa revisarse oeliminarsc. Es preferibleun 
valor positivo para d y entre mis se acerque* 
+ 1.0, mejor. El cuadro 4-8 ilustra los fndicej 
de discriminacibn de seis reactivos de la prue¬ 
ba hipotbtica que se propone aquf. 

Un autor de pruebas puede complementar 
el enfoque de discriminacibn de los reactivos a] 
inspeccionar el numero de personas evaluadas 
en los grupos con puntuaciones mis altas y 
m3s bajas que eligieron cada una de las alterna¬ 
tives incorrectas. Si un reactivo de opcibn null- 
tiple esti bien redactado, las alternativas 
incorrectas deben ser igualmente atracti vas pan 
los participantes que no conocen la respuesta 
correcta. Por supuesto, sc esperarfa que los 
individuos con puntuaciones altas cligieran la 
altcmativa correcta con mayor frecuencia que 
aqubllos con bajas puntuaciones —esc es el pro- 
pbsito de calcular fndices de discriminacibn del 
reactivo. Pero, ademds, un buen reactivo debe¬ 
rfa mostrar una dispersibn proporcional de op- 
ciones incorrectas tanto para los individuos coo 
altas puntuaciones como para aqubllos con ba¬ 
jas puntuaciones. 

Supbngase que se investigan las opciones 
tomadas por 100 individuos con altas puntua¬ 
ciones y 100 con bajas puntuaciones en una 


Cuadro 4-8. fndices de discriminacibn del reactivo de seis reactivos hipotbticos 


Reactivo 

s 

1 

(S-1VN 

Comentario 

1 

49 

23 

.26 

Reactivo muy bueno con dilicultad eievada. 

2 

79 

19 

.60 

Excelente reactivo, pero se obtiene en raras ocasiones. 

3 

52 

52 

.00 

Reactivo deticiente que deberia revisarse. 

4 

100 

0 

1.00 

Reactivo Idepl, pero nunca se obtiene. 

5 

20 

80 

-.60 

Reactivo muy inadecuado que deberia etiminarse. 

6 

0 

100 

-1.00 

0 peor reactivo posibte en tdrminos tebricos. 
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nrueba hipotdlica de opcidn multiple. Las op¬ 
ines conectas se indican con un asterisco (*). 
g| reactivo 1 demuestra el patrdn dcscado de 
f cspuestas, con una dispersidn aproximadamen- 
le igual de las opciones incorrectas. 

Altemativas 

Rea ctivo 1 _ a b c* d e 

Alias puntuacioncs 5 6 80 5 4 

Bajas puntuaciones IS 14 40 16 IS 

En el reactivo 2, se puede ver que ninguno de 
I os alumnos examinados eligid la altcmativa d. 
g$ta debe reemplazarse con un medio de dis- 
tracci6n mis atractivo: 

Reactivo 2_ a b* c d e 

Alias puntuaciones 5 75 10 0 10 

Bajas puntuaciones 21 34 20 0 25 

El reactivo 3 probablemente es deficiente, a 
pesar del hecho de que discrimina entre los par- 
ticipantes con alias y bajas puntuaciones. El 
problema obvio es que los alumnos evaluados 
que tienen altas puntuaciones prefieren la alter- 
nativa a en lugar de la altemativa correcta, d: 

Reactivo 3_ a bed* e 

Altas puntuacioncs 43 6 5 37 9 

Bajas puntuaciones 20 19 22 10 29 

Quizes si se vuclvc a escribir la altemativa a, 
estc reactivo pudiera rescatarse. En cualquier 
caso, el asunto principal aquf es que los auto- 
res de pruebas deben escudrinar en cada rinedn 
de cada reactivo de prueba a travds de todos los 
medios posibles, incluyendo la inspeccidn vi¬ 
sual del patrdn de respuestas. 

REITERACION: LOS MEJORES REACTTVOS 

De todos los mdtodos de andlisis de reactivos 
que se presentan antes, ^cudlcs debe utilizar el 
autor de pruebas para idcntificar los mejores 
reactivos para una prueba? La respuesta a csta 
pregunta no es ni simple ni sencilla. Dcspuds 


de todo, la eleccidn del “mejor” reactivo de- 
pende de los objetivos del autor de la prueba. 
Por ejemplo, un psicdlogo inclinado tedrica- 
mente hacia la investigacidn podrfa querer un 
instrumento de medici6n con la mayor consis¬ 
tency interna posible; los Indices de confiabili- 
dad del reactivo son cruciales para estc objetivo. 
Un administrador universitario con mentalidad 
prdctica podrfa descar un instrumento con la 
mayor validez de critcrio posible; los Indices 
de validez del reactivo serfan utiles para este 
propdsito. Un especialista en retraso mental, 
orientado a la terapdutica, podrfa neccsitar una 
prueba de inteligencia con un efccto mfnimo 
de Ifmile inferior; los Indices de dificultad del 
reactivo serfan Utiles en este sentido. En resu- 
men, no existe un solo mdtodo preferido para 
la seleccidn de reactivos que sea idealmente 
adecuado para todos los contextos de evalua- 
ci6n y desarrollo de pruebas. 

tH REVlSlbN DE LA PRUEBA 

El propdsito del anUlisis de reactivos que se 
analizd anteriormente consiste en idcntificar los 
reactivos improductivos de la prueba prelimi- 
nar de modo que se puedan revisar, eliminar o 
reemplazar. Muy pocas pruebas surgen incdlu- 
mes de este proceso. Es comun dentro del pro- 
ceso evolutivo del desarrollo de pruebas que se 
descarten muchos reactivos, que otros se refi- 
nen y que se aftadan nuevos. La repercusidn 
inicial es que surge una prueba nueva y ligcra- 
mente diferente. Es probable que esta prueba 
revisada contenga mds reactivos discrimina- 
tivos, con mayor confiabilidad y precisi6n 
predictiva mds elevada —pero se sabe que es- 
tas mejorfas son verdaderas s61o en el caso de 
la primera muestra del piloteo. 

El siguiente paso en el desarrollo de una 
prueba consiste en obtener nuevos datos de 
una segunda muestra de piloteo. Por supuesto, 
estos individuos evaluados deben ser similares 
a aqudllos a los que, en ultima instancia, se di- 
rige la prueba. El propdsito de reunir datos adi- 
cionales de una prueba es repetir de nuevo los 
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procedimientos de andlisis de reactivos. Si ios 
cambios posteriores son de una varicdad me- 
nor de tipo afinacidn, el autor puede dccidir que 
la prueba es satisfactoria y que estd lista para 
un esludio de validacidn cruzada, el cual se ana- 
liza en la siguiente seccidn. Si se requieren cam¬ 
bios mayores, es deseablc recolectar datos de 
una tercera e, incluso, quiz$ de una cuarta 
muestra de piloteo. Pero en algun punto deben 
cesar estos pequenos ajustes psicomdtricos; el 
autor debe proponer un instrumento terminado 
y proseguir con el siguiente paso, la validacidn 
cruzada. 

VALIDACI6N cruzada 

Cuando se utiliza una muestra de piloteo para 
determinar que una prueba posee validcz rela- 
cionada con el criterio, la evidencia es bastante 
preliminar y tentativa. En el desarrollo de prue- 
bas, es una priictica prudente la busqueda de 
confirmacidn fresca e independientc de la vali- 
dez de la prueba antes de proceder con la pu- 
blicacidn. El tdrmino valldacidn cruzada se 
refiere a la priictica de utilizar la ecuacidn ori¬ 
ginal de regresidn en una muestra nueva para 
determinar si la prueba predice el criterio de la 
misma manera que en que lo hace la original. 
Ghiselli, Campbell y Zedeck (1981) resumen 
la fundamentacidn para la validacidn cruzada: 

Ya sea que Ios reactivos se elijan con base en 
concordancia empirics o que se corrijan o pon- 
deren, deberlan considerarse como especlficos 
de la muestra que se empled para Ios a nails Is 
estadfsticos, a menos que se obtengan datos 
adldonales. Esto es necesarlo porque exists la 
probabilldad de que Ios resultados obtenidos se 
hayan beneficiado de factores aleatorlos que 
operaron en ese grupo y, por tanto, son aptlca- 
btes sdlo para la muestra ostudiada. 

R£DUCC16n de la validez 

Un descubrimiento comtln en la investigacidn 
de validacidn cruzada es que una prueba predi¬ 
ce el criterio relacionado de manera menos pre- 
cisa con la nueva muestra de examinandos que 


con la original de piloteo. El tdnmino reduction 
de la validez se aplica a este fendmeno. Por 
ejemplo, un medio de prediccidn biogrdfica- 
mente basado del potencial de ventas podri'a 
tener un desempefio bastante adecuado con la 
muestra de individuos que se empie6 para de- 
sarrollar el instrumento, pero demuestra menos 
validez cuando se aplica a un nuevo grupo de 
personas evaluadas. Mitchell y Klimoski (1986) 
cstudiaron la reduccidn de la validez de un ins- 
trumento disenado para predecir cu.lles estu- 
diantcs tcndrdn 6xito en bienes rafces, al medido 
por el criterio real de obtencr una liccncia en 
bienes rafces dos ados despuds. En un an&lisis 
basado en la muestra utilizada para derivar la 
prueba, la prueba predictiva con base biogriifi- 
ca se correlaciond en .6 con el criterio. Pero 
cuando se puso a prueba este mismo instru¬ 
mento con una nueva muestra de estudiantes 
de bienes rafces, la correlacidn con el criterio 
fue menor, cercana a .4; lo cual demuestra una 
reduccidn tfpica de la validez. 

La reduccidn de la validez es una parte ine¬ 
vitable del desarrollo de pruebas y subraya la 
necesidad de obtener una validacidn cruzada. 
En la mayor parte dc Ios casos, la reduccidn es 
leve y el instrumento sobrevive al desaffo de la 
validation cruzada. No obstante, la rcduccidn 
en la validez de una prueba puede representar un 
grave problema cuando las mueslras de deriva¬ 
tion y de validation cruzada son pequerias el 
numero de reactivos potenciales de una prueba 
es grande y dstos se eligen con una base pura- 
mente empfrica, sin fundamentacidn tedrica. 

Un artfculo cldsico escrito por Cureton 
(1950) demuestra el peor escenario posiblc: uti¬ 
lizar una muestra muy pequena para seleccio- 
nar reactivos con concordancia empfrica a partir 
de una reserva de reactivos grande y dc spuds 
validar la prueba con la misma muestra. El cri- 
tcrio en su estudio era el promedio de califtca- 
ciones, dividido de manera artificial en las 
calificaciones de B o mejores y calificaciones 
menores a B. Sus reactivos de “prueba" con- 
sistfan de 85 etiquetas, numeradas de un lado. 
Con cada uno de Ios 29 estudiantes, dstas se 
revolvfan en un recipiente y se dejaban caer 
sobre una mesa. Se registraban todas las que 
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cafan con los numeros hacia arriba como indi- 
cacidn dc la presencia de ese "reactivo" para el 
estudiante. A continuacidn, Cureton llevd a 
cabo un anAlisis de reactivos utilizando las ca- 
lificaciones divididas como criterio. Con base 
en este andlisis, se encontrd que 24 reactivos 
tenfan la capacidad maxima de prcdiccidn dc las 
calificaciones de los cstudiantcs. Nucve de 
ellos se prcscntaron con mayor frecuencia entre 
los estudiantes con mayores calificaciones y 
£stos se ponderaron como +1. Quince reactivos 
ocurricron con mayor frecuencia en el caso de 
los estudiantes con bajas calificaciones y dstos 
se ponderaron como -1. La puntuacidn de esta 
prueba (ir6nicamente llamada “Prueba Pro- 
yectiva B de Psicoquinesia”) consislid de la 
suma de estas 24 pondcraciones de reactivo. 

A pesar de la naturaleza insensata de su 
prueba, Cureton (1950) encontrd que las pun- 
tuaciones de la prueba se correlacionaban en 
.82 con las calificaciones. Por supucsto, la for- 
taleza dc esta correlacidn se debfa por comple- 
lo a que se obtenfa beneficio del azar. Si se 
rcalizara una serie de estudios de validacidn 
cruzada con nuevas muestras dc estudiantes, 
es probable que la correlacidn entre la Prueba 
Proyectiva B de Psicoquinesia y las califica- 
cioncs girarfa mds o mcnos alrededor de cero, 
porquc dsta carece por completo de validez 
predictiva. Esto constituye una importante 
leccidn que se aplica tambien a las pruebas se- 
rias: dcbe demostrarse la validez a travds de va¬ 
lidacidn cruzada, no debe suponerse que existe 
simplemente con base en las solemnes inten- 
ciones de un nuevo instrumento. 

REALIMENTACION DE LAS PERSONAS 
EVALUADAS 

En la revisi6n de la prueba, la realimentacidn 
de las personas evaluadas es una fuente po- 
(encialmente valiosa de informacidn que en 
general pasan por alto los autores de pruebas. 
Se pucde ilustrar este enfoque con la investiga- 
ci6n de Nevo (1992). Este autor desarrolld el 
Examinee Feedback Questionnaire (Cuesliona- 
no de Realimentacidn del Examinando; EFeQ) 


para estudiarel Inter-University Psychometric 
Entrance Examination (Examen Psicomdtrico 
de Ingreso Interuni versilario), uno de los prin- 
cipales requisitos para admisidn a las seis uni- 
versidades de Israel. El Examen de Ingreso 
Interuniversitario es una prueba grupal que 
consiste de cinco subpruebas de opcidn multi¬ 
ple: Conocimientos generates, Razonamiento 
figurativo, Comprensidn, Razonamiento mate- 
mdtico e Inglds. El EFeQ se disefid como una 
posprueba andnima que se aplica de inmediato 
despuds dc contestar el Examen de Ingreso 
Interuniversitario. 

El EFeQ es un cuestionario corto y senci- 
llo, disenado para obtener las opiniones since- 
ras dc las personas evaluadas en cuanto a los 
siguientes rasgos de la matriz prueba-examina- 
dor-persona evaluada: 

* Conducta de los examinadores 

* Condiciones de prueba 

* Claridad de las instrucciones de examen 

* Convenience en el uso de la hoja de respuestas 

* Pcrcepcidn sobre la idoneidad de la prueba 
" Percepcidn sobre imparcialidad cultural de la 

prueba 

* Percepcidn acerca de la suficiencia de tiempo 

* Percepcidn acerca de la dificultad de la prueba 

* Respuesta emocional ante la prueba 

* Nivel de conjeturas 

* Trampa de parte de la persona evaluada u 
otros. 

La pregunta final en el EFeQ es un ensayo li- 
bre: “Estamos interesados en cualesquiera co- 
mentarios o sugerencias que pueda tener para 
mejorar el examen". En la figura 4-9 se pro- 
porcionan algunos ejemplos de las preguntas 
dc realimentacidn similares a las del EFeQ. 

Nevo (1992) determind que el cuestiona¬ 
rio EFeQ posec una confiabilidad modesta, con 
una confiabilidad test-retest de aproximada- 
mente .70. Aparte de las propiedades psicomd- 
tricas de su escala, la tradicidn de pedirles 
realimentacidn a los examinandos acerca dc las 
pruebas ha resultado invaluable. El examen de 
ingreso interuniversitario se modified de diversas 
maneras en respuesta a esta realimcntacidn: el 
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iCuAI es su opinion acerca de la camidad de liompo qua se concede a cada prueba? Marque cada casilla con un numero del 1 al s 
segun las sigulentes calllicaciones: 

5 4 3 2 I 

Oemasrado tiempo Mucho liompo Tiempo adecuado Poco tiempo Muy poco liompo 

I I Conocimientos generates 

(ZD Razonamiento flguiativo 

I I Comprensldn. 

I I Razonamiento matemdtico 

□ Inglds 

/.Usled u otra persona hizo trampa en esle examen? Por lavor marque las casdlas segun se aplique Puede marca/ mis de una casilla 
CD SI—obtuve una copla de la prueba 

□ SI—uno de los exammadores me ayudd de manera ilegal. 
d SI—uno de los examinadores me ayudd durante la prueba 
CD SI—yo ayudd a otro de los examlnandos 

CZJ SI—u«ice notas ocultas durante la prueba. 

—i SI—vi a otra persona haclendo trampa 
I—I No—no Nee ninguna trampa 
l l No—no vlquenadie mas hiciera trampa 


Figure 4-9. Ejemplos de reactivos del cuestlonario do realimenlacidn del examinando. 

Fuente: Basado en Nevo, B. (1992). Examinee feedback: Practical guidelines. In M. Zeidner and R. Most (Eds.), 
Psychological lasting: An inside view. Palo Alto, Calif.: Consulting Psychologists Press. 

la prueba, publicar un manual tdcnico y produ¬ 
ct otro del usuario. Se pueden ofrecer varias 
pautas relevantes para cada uno de estos pasos 
finales, como se describe en las siguientes sec- 
ciones. Por ultimo, se cierra este capftulo con 
un provocativo comentario acerca del conser- 
vadurismo de los editores actuales de pruebas. 

producci6n de los materiales 

DE PRUEBA 

Los materiales de prueba deben ser amigables 
para el usuario, si es que han de recibir amplia 
aceptacidn de parte de psicdlogos y educado- 
res. Asf, una pauta iniciaJ para la produccidn 
de la prueba es que la prescntaci6n ffsica de los 
materiales debe permitir la aplicacidn rapida y 
sin complicaciones. Considdrese el reto que re- 
presentan algunas pruebas de desempeno, don- 
de el examinador debc luchar con el Idpiz, la 
tablilla para anotaciones, el protocolo de prue¬ 
ba, crondmctro, manual de prueba, pantalla para 
los reactivos, caja del reactivo y un objeto de- 
sarmado de cartdn, al mismo tiempo que man- 
tiene una conversacidn con el examinando. 


mato de hoja de respucstas se cambid en los 
sentidos sugeridos por las personas evaluadas; 
el Ifmite de tiempo se amplid para pruebas espe- 
effleas de las que se informd que eran dema- 
siado rdpidas, y se eliminaron ciertos reactivos 
percibidos como parciales o poco equitativos. 
Ademds, se revisaron y estrecharon las medidas 
de seguridad a fin de reducir el copiado, que 
era m£s predominant de lo que los examina¬ 
dores habfan anticipado. Nevo (1992) tambidn 
cita una ventaja oculta de los cuestionarios de 
realimentacidn: transmiten el mensaje de que 
existe alguicn a quien le interesa escuchar, lo 
cual reduce el estrds posterior al examen. Los 
cuestionarios de realimentacidn de los exami- 
nandos deben volverse una pr&ctica rutinaria 
en las pruebas grupales estandarizadas. 

H PUBUCACI6N DE LA PRUEBA 

El proceso de construccidn de pruebas no tcr- 
mina con la obtencidn de los datos de valida- 
cidn cruzada. El autor de pruebas tambidn debe 
supervisar la produccidn de los materiales de 
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Sj el autor de la prueba cstd en posibilidad de 
simplifies los deberes del examinador al mis- 
[Tl0 tiempo que permite que las demandas de la 
[area sean iguales para el examinando, el ins- 
trumento resultante tendrd una aceptabilidad 
mucho mayor para los usuarios potenciales. Por 
ejemplo, si las instrucciones de aplicacidn 
pueden resumirse en el protocolo de prueba, cl 
examinador puede hacer a un lado el manual 
mientras que coloca la tarea frente al exami¬ 
nando. 0(ra adicidn bicn recibida para la pre¬ 
sentation de la prueba psicoldgica es la encua- 
dernacidn con engargolado, la cual tiene la 
posibilidad de colocarse de manera vertical y 
que mucstra las preguntas de prueba en la cara que 
se presenta al examinando a la vez que propor- 
ciona las instrucciones de aplicacidn en el lado 
contrario que da hacia cl examinador. 

MANUAL TlCNICO Y MANUAL 
DEL USUARIO 

En general, los datos tdcnicos acerca de un nue- 
vo instrumento se resumen con las referencias 
apropiadas en un manual tlcnico. En dste, el 
futuro usuario puede encontrar informacidn 
acerca del andlisis de los reactivos, confiabilida- 
des de escala, estudios de validacidn cruzada y 
similares. En algunos casos, esta informaci6n 
se incorpora en el manual del usuario, que da 
instrucciones para la aplicacidn y tambiln 
proporciona las pautas para la interpretacidn 
de la prueba. 

Los manuales de prueba deben comunicar 
informacidn a muchos grupos diferentes, que 
abarcan en cuanto a antecedentes y entrena- 
mientodesde los especialistas en medicidn hasta 
el maestro en el saldn de clases. Los manuales de 
prueba salisfacen muchos propdsitos, como sc 
describe en los Standards for Educational and 
Psychological Testing (AERA, APA, NCME, 
1985,1999). Este influyentc compendio de los 
Standards sugiere que los manuales de prueba 
deben alcanzar los siguientes objetivos: 

• Describir la fundamentacidn y usos recomcn- 
dados de la prueba. 


• Proporcionar advertencias especfficas en con¬ 
tra del mal uso anticipado de una prueba. 

• Citar estudios representatives concemientes 
a usos gcncralcs y especfficas de una prueba. 

• Identificar los requisitos especialcs necesa- 
rios para aplicar e interpretar la prueba. 

• Proporcionar revisiones, enmiendas y com- 
plementos segun sea necesario. 

• Utilizar material promocional que sea preci- 
so y basado en invcstigacidn. 

• Citar relaciones cuantitativas entre las pun- 
tuaciones de una prueba y los criterios. 

• Informar del grado en que se pueden inter- 
cambiar los modos altemativos de respuesta 
fp. ej„ folleto contra una hoja de respuesta). 

• Proporcionar auxi I iarcs interpretativas apropia- 
dos para la persona que realiza la prueba. 

• Suministrar evidencia de la validez de cua- 
lesquier interpretaciones automdticas de una 
prueba. 

Por tfltimo, los manuales de prueba deben 
proporcionar datos esenciales acerca de la con- 
fiabilidad y validez, en vez de referir al usuario 
hacia otras fuentes —una prdctica desafortu- 
nada que se encuentra en algunos manuales de 
prueba. 

LAS PRUEBAS SON UN GRAN 
NEGOaO 

En este momento, el lector deberd advertir la 
desafiantc tarea que enfrenta todo aquel que se 
propone desarrollar y publicar una nueva prue¬ 
ba. Ademds de las titdnicas proporciones de la 
empresa, el desarrollo de pruebas es extraordi- 
nariamente costoso, lo cual significa que los 
editores tienen una actitud de naturaleza con- 
servadora en cuanto a la presentacidn de nue- 
vas pruebas. Jensen (1980) proporciona la 
siguiente perspectiva tentadora acerca de este 
tema: 

Pfoducir una nueva prueba de inteligencla gene¬ 
ral que represente una mejoria verdaderamen- 
te significative, por enclma de los instrumentos 
oxistentes, seria un proyecto multimillonario que 
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requerirfa gran canOdad da personal constltuido 
de expert os en construccion de pruebas que 
trabajen durante varios afios. Hoy en dia poseo- 
mos la tecnologla psicomPtrlca necesarla para 
producir pruebas considerablemente mojores 
que las que se utilizan a nlvol popular en la ac- 
tualldad. Los principales obstdculos son las le- 
yes de derecbos de autor. los intoresos creados 

HrESUMEN 


1. La construed 6n de pruebas consiste de seis 
etapas cntrelazadas: definicidn de la prue- 
ba, selecci6n de un mdtodo de cscalamien- 
to, construccidn y aniilisis de los reactivos, 
asf como la revisidn y publicacidn de la 
prueba. 

2. Los autores de pruebas necesitan seleccio- 
nar un mdtodo de esealamiento que se adc- 
cue en forma 6ptima a la manera en que han 
concebido el rasgo o rasgos que mide la 
prueba. El concepto de niveles de medicidn 
es sumamente relevante en este contexto. 

3. Se reconocen cuatro niveles de medicidn: 
las escalas nominales constituyen la simple 
denominacidn 0 catcgorizacidn; las escalas 
ordinates permiten una clasificacidn; las es¬ 
calas de intervalo poseen intcrvalos igua- 
les; las escalas de razdn incorporan todas 
las caracterfsticas anteriores y tambidn in- 
troducen un cero absoluto. 

4. Existen docenas de mdtodos de esealamien¬ 
to. Ejemplos representatives incluyen el 
mdtodo de esealamiento absoluto, en el que 
la dificultad del reactivo se localiza en un 
eje o Ifnea base y se mide en unidades de 
desviacidn estindar en un gnipo base; las 
escalas Likert, que presentan reactivos con 
cinco respuestas ordenadas en un continuo 
de acuerdo/desacuerdo; y el enfoque de es¬ 
ealamiento racional en el que los reactivos 
derivados de manera racional se correlacio- 
nan con las puntuaciones totales de una 
prueba. 

5. La construccidn de los reactivos de una prue¬ 
ba es un procedimiento laborioso y lento. 
Los autores de pruebas deben evitar los efec- 


que tionon los editores en las pruebas esta- 
blecidas en las que ya han realizado enormes 
Lnvorsionos, y la economla de morcado de las 
pruebas. La mejorla importante de las pruebas 
no es, de inlcio, una aventura comorcial atractlva 
y es probable que tuviera que depender de subsi- 
dios a gran escala y a largo plazo de Instancias 
gubemamentales y tundaclooes pnvadas. 


tos de Ifmite superior c inferior. En un efec- 
to de Ifmite superior, cantidades importantes 
de personas evaluadas obtienen puntuacio- 
nes perfectas o casi perfectas. En un efccto 
de Ifmite inferior, cantidades significati- 
vas de personas obtienen puntuaciones en 
o cerca de la parte m£s baja de la escala. 

6. Una tabla de especificaciones enumera la 
informacidn y tareas cognitivas en las que 
se ha de evaluar a las personas examinadas. 
En el caso de las pruebas de rendimiento y 
capacidad, los redactores de los reactivos 
trabajan, por lo general, a partir de la tabla 
de especificaciones para garantizar que el 
instrumento en progreso detecta la mczcla 
deseada de procesos cognitivos y conteni- 
dos de un reactivo. 

7. Los reactivos de una prueba pueden re- 
dactarse en muchos formatos diferentes, 
incluyendo opcidn multiple, respuestas abier- 
tas, falso-verdadero y eleccidn forzada. Las 
correspondencias, tan populares en las 
pruebas para saldn de clase, son cuestiona- 
bles en tdrminos psicomdtricos, dado que 
las opciones no son independientes entre sf. 

8. El propdsito del an^lisis de los reactivos 
consiste en determinar cudles de los inicia- 
les han de conservarse, cuales revisarse y 
curies eliminarse. Se tienen disponibles mu¬ 
chos procedimientos estadfsticos para cl 
aniilisis dc reactivos, que incluyen el fndice 
de dificultad del reactivo, el fndice de 
confiabilidad del reactivo, el fndice de vali- 
dez del reactivo, la curva reactivo-caracte- 
rfstica y el fndice de discriminacidn del 
reactivo. 
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9 . El tdrmino validation cruzada sc refiere a 
|a prictica de volver a validar una prueba 
con una nueva mueslra dc personas exami- 
nadas. Reduccion de la validez sc refiere 
al fcndmeno comun en el que una prueba 
predicc el critcrio relacionado de manera 
menos precisa con una nueva muestra que 
con aquella original de piloteo. 

B T^RMINOS Y CONCEPTOS CLAVE 


Escalas nominales 

p. 145 

Escalas ordinales 

p. 145 

Escala de intervalo 

p. 145 

Escala de raz6n 

p. 146 

Clasiflcaciones dc expertos 

p. 147 

M&odo de intervalos de 
aparicidn balanceada 

p. 148 

Metodo de escalamicnto 
absoluto 

p. 149 

Escalas Likert 

p. 150 

Escalas Guttman 

p. 150 

Mltodo de concordance 
empfrica 

p. 150 

Mitodo de escalamiento 
racional 

p. 151 


10. Las prucbas deben ser amigables para cl 
usuario si cs que han de recibir amplia acep- 
tacidn de parte de psicdlogos y cducado- 
res. Por ejemplo, la encuademacidn con 
cngargolado, que permite la colocacidn ver¬ 
tical y que muestra las instrucciones cn un 
lado y los estfmulos de prueba en el otro, es 
especial mente deseable. 
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Metodologfa de elcccidn 
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Tema 5A 

Teonas y medicion de la 
inteligencia 

Definiciones de inteligencia 

Ejemplo de caso 5-1. Aprendizaje y adaptacidn como (unciones 
elementales de la inteligencia 

Teorias de la inteligencia 

Resumen 

T6rminos y conceptos clave 


P1 T U L 0 

HMonnHU 


Este capftulo inicia una amplia discusidn 
de las pruebas de inteligencia, un tema tan im- 
portantc y extenso que se le dedican los siguien- 
tes dos capftulos. A fin de comprender las 
pmebas actuates de inteligencia, el lector nece- 
sitar5 asimilar ciertas definiciones, teorfas y 
ptdcticas convencionales de cvaluacidn. El ob- 
jetivo del Tema 5A, Teorfas y medicidn de la 
inteligencia, consiste en investigar los di versos 
significados dados al tdrmino inteligencia y 
analizar la maneraen que las definiciones y teo- 


rfas han influido en la cstructura y contcnido 
de las pruebas de inteligencia. Una justifica- 
cidn importante para este tema es que la com- 
prensidn de las teorfas de la inteligencia es 
importante para establecer la validcz de 
constructo de las mcdidas de Cl. En el Tema 
5B, Evaluacidn de las capacidades de lactantes 
y preescolares, se revisa la naturaleza y aplica- 
cidn de los principalcs instrumentos de eva- 
luacidn de lactantes y despuds se invcstiga una 
cuestidn fundamental: la utilidad practica de 


169 













170 • Evaluation psicologlca: Hlslorla, printiplos y apllcadones 


(Capitulo S) 


estos instrumentos. Sc iniciard con una revi- 
si6n de las teorfas iniciales, tradicionales y con- 
temporaneas acerca de la inteligencia. 

La inteligencia es uno de los tcmas que mds 
se han invcstigado en psicologfa. Cada ado se 
publican miles de artfculos de investigacidn 
sobre su naturalcza y medicidn. Han surgido 
revistas como Intelligence y The Journal of 
Psychoeducational Assessment, en respucsta al 
intcrds academico en esta materia. A pesar de 
la extensa bibliograffa de investigaci6n, la defi- 
nicidn de inteligencia aun cs esquiva, envuelta 
en la controversia y el misterio. De hecho, el 
andlisis que se presents a continuacidn ilustrard 
una de las principales paradojas de la evalua- 
cidn modema con pruebas: , los psicdmetras 
explican mejor la medicidn de la inteligencia que 
su definicidn! 

Aunque esta definicidn ha resultado una 
labor frustrantc, pucde obtenerse mucho de la 
rcvisidn de los esfuerzos anliguos y actuates 
para aclarar su significado; despuds de todo, 
las pruebas de inteligencia no se materializa- 
ron de la nada; la mayor parte se fundamentan 
en una teorfa especffica de la inteligencia y 
muchos de los que las elaboran ofrccen una de- 
finicidn del constructo como punto inicial de 
sus esfuerzos. Porestas razones, se puede com- 
prender y evaluar mejor el cardcter multifacetico 
de las pruebas contcmpordneas si se revisan pri- 
mero las principales definicioncs y teorfas de 
la inteligencia. 


P DEFINICIONES DE INTEUGENCIA 


Antes de analizar las dcfiniciones de inteligen¬ 
cia es ncccsario aclarar la naturaleza de la defi- 
nicidn en sf. Sternberg (1986) distingue entre 
definiciones operacionales y “reales", lo cual 
es importante en este contexto. La primera de¬ 
fine un concepto en tdrminos de edmo se mide 
dicho concepto. Boring (1923) Ilev6 este punto 
de vista a su extremo cuando definid la inteligen¬ 
cia como “aquello que miden las pruebas". Por 
increfble que parezea, dsta fue una propucsta 
seria, disenada en gran medida para evitar los 


grandcs dcsacuerdos acerca de la dcfinicidn dc 
inteligencia. 

Las definiciones operacionales de inteligen¬ 
cia sufren de dos peligrosas desventaja* 
(Sternberg, 1986). Primero, son circulares. La* 
pruebas de inteligencia se inventaron para me- 
dir la inteligencia, no para dcfinirla. Quienes 
discharon las pruebas nunca tuvieron la inten- 
ci6n de que sus instrumentos definieran a la 
inteligencia. En segundo lugar, las definicio¬ 
nes operacionales impiden un mayor progreso 
en cuanto a la comprensidn de la naturaleza de 
la inteligencia, porque anulan el andlisis acerca 
de la idoneidad de sus teorfas. 

Este segundo problema —los efectos po- 
tencialmente entorpecedores dc depender de 
las definiciones operacionales de inteligencia— 
hace dudar de la prdctica comun de afirmar la 
validcz concurrence de nuevas pruebas al 
correlacionarlas con pruebas anteriores. Si las 
pruebas establccidas sirven como el criterio 
principal contra el cual se evaluan las nuevas, 
entonces cstas ultimas se considerarAn vAlidas 
s6!o en el grado en que se correlacionen con 
las pruebas antiguas. Dicha prdctica conserva- 
dora reduce de manera drdstica la innovacidn, 
La definicidn operacional de inteligencia anu- 
la la posibilidad de que pruebas o conccptos de 
inteligencia novedosos puedan ser superioress 
los existences. 

Por tanto, se debe concluir que las defini¬ 
ciones operacionales de inteligencia dejan mu¬ 
cho que desear. En contraste, una definicldn 
real es aquclla que busca explicar la verdadcra 
naturaleza de lo que se define (Robinson, 1950; 
Sternberg, 1986). Quizes el modo m5s comun 
—pero de ninguna manera cl unico— dc pro¬ 
duct definiciones reales de inteligencia con- 
sista en pedirle a expertos en la materia que li 
definan. 


DEFINICIONES DE EXPERTOS 
ACERCA DE LA INTELIGENCIA 

Investigadores destacados en cl drea han pro- 
porcionado muchas definiciones reales de U 
inteligencia. A continuacidn se dan varios ejem- 
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plos, parafraseados ligeramentc para darles con- 
sistencia editorial. El lector observar£ que mu- 
c has de estas definiciones aparecieron en un 
gjmposio inicial, pero que aun goza de influen¬ 
ce "Intelligence and its Measurement", publi¬ 
co en el Journal of Educational Psychology 
(Thorndike, 1921). Otras definiciones provie- 
nen de una actualizacidn modema de este pri¬ 
mer simposio, “ What is Intelligence?", editado 
por Sternberg y Detterman (1986). La inteli- 
gencia se ha definido como sigue: 

Spearman (1904, 1923): una capacidad ge¬ 
neral que implica principalmente la de- 
duccidn de relaciones y corrclatos. 

Binet y Simon (1905): la capacidad para juz- 
gar bien, para comprender bien y para ra- 
zonar bien. 

Terman (1916): la capacidad para formar 
conceptos y para comprender su impor¬ 
tance. 

Pintner (1921): la capacidad del individuo 
para adaptarse de mancra adccuada a las 
situaciones relativamente nuevas de la 
vida. 

Thorndike (1921): el poder de dar buenas 
respuestas, desdc cl punto de vista de la 
verdad o el hecho. 

Thurstone (1921): la capacidad para inhibir 
las adaptaciones instintivas, para ima- 
ginar de manera flexible diferentes res¬ 
puestas y para realizar adaptaciones 
instintivas modificadas en conducta ma- 
nifiesla. 

Wcchsler (1939): el conjunto o capacidad 
global del individuo para actuar de ma¬ 
nera propositiva, pensar de manera racio- 
nal y enfrcntarse de mancra cfectiva con 
el ambiente. 

Humphreys (1971): el repertorio completo 
de habilidades, conocimiento, inclinacidn 
para el aprendizaje y tendcncias a la ge- 
neralizacidn adquiridos, considerados de 
naturaleza intelectual y que est£n dispo- 
nibles en un momento determinado. 

Piaget (1972): un tdrmino gendrico que in- 
dica las formas superiores de organiza- 


cion o equilibrio de la estructura cognitiva 
que se utilizan para la adaptacidn al am¬ 
biente ffsico y social. 

Sternberg (1985a, 1986): la capacidad men¬ 
tal para automatizar el procesamiento de 
informacidn y para emitir en un contexto 
la conducta adecuada en respuesta a 
situaciones novedosas; la inteligencia 
tambidn incluye metacomponentes, com- 
ponentes de ejecucidn y de adquisicidn 
del conocimiento (los cuales se analizan 
despuds). 

Eysenck (1986): transmisidn correcta de la 
informacidn a travds de la corteza. 

Gardner (1986): la capacidad o habilidad 
para resolver problcmas o para crear pro- 
ductos que se considcran valiosos dentro 
de uno o mds entomos culturales. 

Ccci (1994): capacidades innatas multiples 
que dan un rango de posibilidades; dstas 
se desarrollan (o dejan de desarrollarse 
o se desarrollan y despuds se atrofian) de- 
pendiendo de la motivacidn y exposicidn 
a experiencias educativas relevantes. 

La lista de definiciones anterior es representa- 
tiva, aunque no definitiva ni exhaustiva. En pri¬ 
mer lugar, dsta cs exclusivamcnte occidental y 
omite varios conceptos transculturales de la 
inteligencia. Por ejemplo, los conceptos orien- 
tales acerca de dsta enfatizan la benevolencia, 
humildad, libertad con respecto a las normas 
convencionales de juicio y la realizacidn de 
aquello que es correcto como partes esencia- 
les de la inteligencia. Muchos conceptos afri- 
canos de la inteligencia dan un enorme dnfasis a 
sus aspectos sociales, como el mantenimiento 
de relaciones armoniosas y estables dentro del 
grupo (Sternberg y Kaufman, 1998). El lector pue- 
de consul tar a Bracken y Fagan (1990), Sternberg 
(1994) y Sternberg y Detterman (1986) para 
ideas adicionales. Seguramente esta muestra de 
perspectivas es suficiente para demostrar que 
parece haber tantas definiciones de la inteligen¬ 
cia jeomo expertos dispuestos a dcfinirla! 

A pesar de la diversidad de puntos de vista, 
dos temas se repiten una y otra vez en las defi¬ 
niciones. En t6rminos amplios, los expertos tien- 
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den a concordar en que la inteligencia es 1) la 
capacidad para aprcndcr dc la experiencia y 
2) la capacidad para adaptarse al propio am- 
biente. El hecho de que tanto el aprendizaje 
como la adaptacibn sean import antes para la 
inteligencia se destaca en gran medida en cier- 
tos casos de discapacidad mental, donde las 
personas no poseen una u otra capacidad en 
grado suficicntc (ejemplo de caso 5-1). 

^Qud tan bicn captan las prucbas de inteli¬ 
gencia la pcrspcctiva de los expcrtos accrca de 
que la inteligencia consiste en el aprendizaje a 
partir de la experiencia y de la adaptacibn al 
ambiente? El lector debc manlcner en mente 
esta pregunta a medida que continue la revi¬ 
sion de las principals pruebas de inteligencia 
en los temas que siguen. Con seguridad existe 
causa para preocuparse: muy pocas pruebas de 
inteligencia contempordneas parecen rcquerir 
que la persona evaluada aprenda algo nuevo 
o sc adapte a una nueva situacibn como parte 
escncial del proceso dc cxamen. En el mejor 
de los casos, las principals pruebas actuates 
proporcionan mcdidas indirectas dc las capaci- 
dades para aprender y adaptarse. Qud tan bien 
captan estas dimensiones es una pregunta em- 
pfrica que debe demostrarse a travds de inves- 
tigacibn de la validez. 


CONCEPTOS DE LEGOS Y EXPERTOS 
ACERCA DE LA INTELIGENCIA 

Otro enfoquc para comprender un constructo 
consiste en estudiar su significado popular. Este 
mdtodo es mbs cientffico de lo que podrfa pa- 
recer. Las palabras tienen un significado comun 
en cl sentido dc que ayudan a proporcionar una 
imagen eficaz de las transacciones cotidianas. 
Si los legos pueden estarde acucrdocon su signifi¬ 
cado, un constructo como la inteligencia es, en 
cicrto sentido, algo “real” y, por tanto. potencial- 
mente util. En tal caso, preguntar a personas en 
la calle “£qud significa para usted la palabra 
inteligencia?”, tiene mucho a su favor. 

Sternberg, Conway, Ketron y Bernstein 
(1981) llevaron a cabo una serie de estudios 
para investigar los conceptos de los adultos esta- 


dounidenscs acerca de la inteligencia. En el prj. 
mer estudio, se le pidib a personas que entra- 
ban a una estacibn de trenes, a un supcrmercado 
o que estudiaban en una biblioteca universitj. 
ria, que listaran las conductas caracterfsticasde 
diversos tipos de inteligencia. En un segundo 
estudio —el unico que se analiza aquf— tanto 
legos como expertos (principalmente psicblo- 
gos acaddmicos) calificaron la importancia dc 
estas conductas para su concepto de la persona 
con “inteligencia ideal”. 

Las conductas centrales para los concep¬ 
tos dc expertos y legos accrca de la inteligen¬ 
cia resultaron ser muy similares, aunque no 
iddnticas. En orden de importancia, los exper- 
los consideraron que la inteligencia verbal, la 
capacidad de solucibn de problemas y la inteli¬ 
gencia prbctica son importantes para la inte¬ 
ligencia. Los legos consideraron a la capacidad 
de solucibn de problemas, la capacidad verbal 
y la compctcncia social como factores funda- 
mentales de inteligencia. Por supucsto, las opi- 
niones no fueron unbnimes; estos conceptos 
rcprcsentan el punto de vista consensual de cada 
grupo. Los componentes de la inteligencia y 
sus elementos descriptivos csenciales se mues- 
Iran en el cuadro 5-1. 

En sus conceptos dc inteligencia, los ex¬ 
pertos enfatizaron la capacidad verbal mbs que 
la solucibn de problemas; mientras los legos 
invirtieron estas prioridades. No obstante, am- 
bos grupos consideraron que estos dos elementos 
son aspcctos esenciales de la inteligencia. Como 
verb el lector, la mayor parte de las pruebas de 
inteligencia tambidn accntuan estas dos capaci- 
dades. Ejemplos prototfpicos serian vocabulario 
(capacidad verbal) y disefio con cubos (solu- 
cibn de problemas) de las escalas Wechsler, las 
cuales se analizan posteriormente. Por tanto. puede 
verse que los conceptos cotidianos dc inteligen¬ 
cia se reflejan, en parte, de manera bastante fiel 
en las pruebas modemas de inteligencia. 

Tambidn es evidente cierto desacuerdo en- 
tre expertos y legos. Los primeros conside- 
ran que la inteligencia prbctica (evaluacibn de 
situaciones, determinacibn dc cbmo lograr 
melas, concicncia e interds en el mundo) es 
un componcnte esencial de la inteligencia. 
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Ejemplo DE CASO 5-1 

APRENDIZAJE Y ADAPTAa6N COMO FUNCIONES ELEMENTALES DE LA INTELIGENCIA 

Es frecuente que las personas con discapacidad menial demuestren la imporlancia del aprendizaje 
por experiencia y de la adaptacibn al ambiente como Ingredientes clave de la Intellgencia. 
Conslddroso la hlstoria clfnica de un vendedor de perlbdlcos de 61 afios de edad, con retraso 
mental moderado, quien era muy conocido para los especialistas en salud mental de la localidad. 
Era un hombre interesante, por no declr excbntrico, que almacenaba alimentos enlatados en su 
refrlgerador y maldeda a los trabajadores de la beneficencia que pasaban a verlo para verilicar 
su siluacibn. A pesar de su necesidad de apoyo econbmico de una dependencia del estado, era 
ferozmente independienle y adminlslraba su propio hogar con minima supervisibn de los 
encargados de su caso. Aal, en muchos sentldos mantenia una adaptacibn lenue con su ambiente. 
Para ganar el ingreso adicional que mucho necesitaba, vendla un dlario local con un coslo de 25 
centavos en un quiosco de la calle. Reconocla que la moneda de 25 centavos era el pago 
adecuado y habfa aprendido a dar Ires monedas de 25 centavos como cambio de un blllete de 
un dblar. Se negaba a aceptar otras lormas de pago, un arreglo que sus cllentes podlan aceptar. 
Pero un dla aumentb el precio del peribdico a 35 centavos y el vendedor de perlbdlcos, que 
sufrfa retraso mental, so vlo forzado a manejar monedas de 10 y 1 centavo, asi como las de 25 
centavos y billetes de dblar. La cantldad de aprendizaje que se requeria por este leve cambio en 
las demandas del ambiente superb sus capacidades intelectuales y, desgraciadamente, pronto 
quedb (uera del negocio. Sus intentos fallidos resaltan los ingredientes esenciales de la 
inteligencia: el aprendizaje a partir de la experiencia y la adaptacibn al ambiente. 


Cuadro 5-1. Factores y elementos de muestra que subyacen a los conceptos 
de intellgencia de legos y expertos 


Legos 

Expertos 

Capacldad de solucibn de problemas prictlcoa 

Inteligencia verbal 

Razona de manera logica y correcta 

Ostenta un buen vocabularlo 

tdentilica las conexlcones entre ideas 

Lee con elevada comprensldn 

Puedo ver todos los aspectos de un problems 

Tiene curiosldad 

Conserva la monte ablorta 

Es inquisitivo en un sentido inteledual 

Capacldad verbal 

Capacldad de solucibn de problemas 

Habla con daridad y de manera arliculada 

Capaz de aplicar el conocimiento a los proble- 

Tiene llu'doz verbal 

mas que se le presenter! 

Tlene buena conversadbn 

Toma buenas decisiones 

Estt Wen informado sobre su campo particular 

Plantea los problemas de manera Optima 

de conodmientos 

Tiene sentido comOn 

Competencla social 

Intellgencia prbctlca 

Acepta a los dembs por lo que son 

Aprovecha bien las situaciones 

Admlte sus errores 

Dotormina cbmo lograr las metas 

Tiene Interns en el mundo en general 

Tiene conciencia del mundo 

Lega a tiempo a sus dtas 

Muestra interes por el mundo en general 


Stores' Ca< k* * ac *° f 56 enumeran los elementos con las cargas mis alias Los investigadores determlnaron los nombres de los 

o| , |n?1i R * pro<,ucido con au,ori2ad<;>n do Sternberg, R. J„ Conway. B. E. Ketron, J. L y Bernstein, M (1081) People's conceptions 
ln '*‘ flence. Journal ot Personality and Social Psychology. 41 , 37-56. 
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mientras los legos identifican a la competencia 
social (aceptar a los otros individuos como son, 
admitir los errores, la puntualidad y el interds 
en el mundo) como un tercer componenic. Sin 
embargo, estas dos nominaciones compartcn 
una propiedad: las pruebas contemporflncas no 
intentan medir ya sea la inteligencia prictica o 
la competencia social. Esto refleja, en parte las 
dificultades psicometricas que se enfrentan en 
el diseflo de reactivos dc una prueba pertinente 
para estas Areas de contenido. No obstante, la 
principal razdn por la que las pruebas de inteli¬ 
gencia no miden la inteligencia prActica o la 
competencia social es la inercia: los autores de 
pruebas han aceptado a ciegas los conceptos 
histdricamente incompletos acerca de la inteli¬ 
gencia. Hasta hace poco tiempo, el desarrollo 
de estas pruebas habfa sido una cuestidn con- 
servadora, con poco cambio dcsde los tiempos 
de Binet y de las pruebas Army Alfa y Beta 
dirigidas a los reclutas de la primera Guerra 
Mundial. Sin embargo, existcn algunas sefiales 
de que es posible que las prActicas de prueba 
evolucionen en prdximas fechas, con el desa¬ 
rrollo de instrumentos innovadores. Por ejem- 
plo, Sternberg y colaboradores han propucsto 
pruebas innovadoras basadas en su modelo de 
inteligencia. Otro instrumento interesante, ba- 
sado en un nuevo modelo de inteligencia, es el 
Everyday Problem Solving Inventory (Inventario 
de solucidn de problcmas cotidianos; Cornelius 
y Caspi, 1987). En esta prueba, los exami- 
nandos debcn indicar su respuesta tfpica a 
problemas cotidianos como no llevar dinero, la 
chequera o una tarjeta de crddito cuando invi- 
tan a comer a un amigo. 

Se volverA ahora la atencidn hacia una re- 
visidn de las principaies teorfas de la inteligen¬ 
cia. Como recordatorio, debe decirse que la 
justificacidn para revisar las teorfas consiste en 
ilustrar la manera en que Astas han influido 
en la estructura y contenido de las pruebas 
de inteligencia. AdemAs, la validez de cons¬ 
truct de las pruebas de Cl depende del grado 
en que encamen teorfas especfficas de la inte¬ 
ligencia, dc modo que tambidn es pertinente 
una revisi6n de las teorfas para la validacidn 
de pruebas. 


M TEORIAS DE LA INTELIGENCIA 

GALTON Y LA AGUDEZA SENSORIAL 

Las primeras teorfas de la inteligencia surgie- 
ron en la era de los instrumentos de bronce dc 
la psicologfa, a principios del siglo XX. El lec¬ 
tor recordarA del Tema 1A que Sir Francis 
Gallon y su discfpulo, J. McKeen Called, con- 
sideraban que la inteligencia sc sustenta en las 
capacidades sensorialcs agudas. Esta suposi. 
cidn incompleta y engafiosa se bas6 en una pre- 
misa plausible: 

La untca InformacICn que llega a nosotros acer¬ 
ca de los aoontecimientos externos paroco atra- 
vesar por las avenldas de nuestros sentidos; y 
entre mas perceptivos sean los sentidos de la 
dlferencla, mayor es el campo sobre el que pue- 
de actuar nuestro juiclo e Inteligencia (Oalton, 
1883). 

La teorfa de la agudeza sensorial acerca de la 
inteligencia, que promovieron Gallon y Cattell, 
resultd seren gran medida un callejdn sin sali- 
da en el sentido psicometrico. Sin embargo, hay 
vestigios de este enfoque en los anAlists 
cronomdtricos actuates, como el del aparatode 
Tiempo de reaccidn-Tiempo de movimiento 
(TR-TM), un mdtodo experimental que favorece 
Jensen (1980) para el estudio de la inteligencia 
sin influencia de la cullura (figura 5-1). En los 
estudios dc TR-TM, se instruye al participante 
para que coloque el dedo fndice de la mano pre- 
ferida en el botdn de inicio; despuds se hac« 
sonar una sefial auditiva a la que le sigue (en 1 
a 4 segundos) el encendido dc 1 de 8 luces 
verdes, que el individuo debe apagar con la 
mayor velocidad posible al tocar el botdn del 
microinterruptor directamente debajo de clla 
El TR es el tiempo que requiere el participante 
para retirar su dedo del botdn de inicio despuds 
de que se ha encendido una luz verdc. El TM 
es el intervalo entre el que retira su dedo del 
botdn de inicio y toca aquel que apaga la lux 
verde. Jensen (1980) informd que los indices 
de TR y de TM se correlacionan en niveles tan 
altos como .50 con pruebas psicometricas tra- 
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Not*: los clrcutos btancos son los Interruptoies. loe cfrcukxs con 
una cniz son las senates luminosas verdos 


Figura 5-1. Aparalo de tiempo de reacckSn-tiempo de 
movimlento. 

Fuente: Reimpreso con autorizaciOn de Jensen. A.R. 
(1980). Bias In menial testing. Nueva York: Free Press. 
Copyright © 1980 de Arthur R. Jensen. Reimpreso con 
autorizacidn de Free Press, una division de Simon & 

Schuster 

dicionalcsde la inteligcrcia.* P. A. Vernon lam- 
bidn ha informado sobre rclaciones sustancia- 
les —tan alias como .70 para correlaciones 
multiples—entre medidas de velocidad de pro- 
ccsamicnto del tipo de TR y medidas tradicio- 
nales de inleligencia (Vernon, 1994; Vernon y 
Mori, 1990). Eslos descubrimientos sugieren 
que las medidas de velocidad de procesamien- 
tocomo el TR podrfan ser una adicidn util para 
las baterfas cstandarizadas de pruebas de inte- 
ligencia. En general, los autores de pruebas se 
han resistido a las implicaciones de csta lfnea 
de invcstigacidn. 

SPEARMAN Y EL FACTOR G 

Con base en un amplio esludio de los patroncs 
de correlaciones entre diversas pruebas de capa- 
cidad intelectual y sensorial, Charles Spearman 
(1904,1923, 1927) propusoque la intcligencia 
tonsistfa en dos tipos de factores; un solo fac- 


De hecho. cl coeficicnlc bruto de corrclacidn es nega- 
livo porque los tiempo de rcaccidn mis nipidos (pun- 
•ttaciones numdricas mcnores) se relacionan con 
puntuaciones mis alias de inleligencia. 


tor general, g, y numcrosos factores espeef- 
ficos, s,, Sj, s r y asf sucesivamente. Como adi¬ 
cidn importante para su teoria, Spearman ayudd 
a inventarel analisis factorial como auxiliar para 
su invcstigacidn sobre la naturaleza de la inte- 
ligencia. Este autor ulilizd esta tdcnica esta- 
dfstica para distinguir el numero de factores 
subyacentes independientes que deben existir 
para explicar las correlaciones observadas en¬ 
tre un gran numero de pruebas. 

Desde la perspectiva de Spearman, el des- 
emperio de una persona evaluada con cualquier 
prueba o subprueba homngdnea de la capaci- 
dad intelectual estaba determinado principal- 
mente por dos influences: g, el factor general 
dominante, y s, un factor especffico de esa prue¬ 
ba o subprueba. (Un factor de error, e, tambidn 
puedc influiren las puntuacioncs, pero Spearman 
bused reducir al mfnimo esta influcncia al uti- 
lizar instrumentos sumamente confiables.) 
Debido a que el factor especffico s era diferen- 
te en cada prueba o subprueba intelectual, y en 
general tenfa menos influencia que g en la de- 
terminacidn del nivel de desemperio, Spearman 
expresd menos interds en estudiarlo. Se con- 
centrd principalmente en la definicidn de la 
naturaleza de g, la cual vinculaba con una “ener- 
gfa” o “fuerza” que surte en comtrn a toda la 
corteza. En contraste, consideraba que s, el fac¬ 
tor especffico, tenfa un sustrato fisioldgico lo- 
calizado en el grupo de neuronas que cubren el 
tipo particular de operacidn mental que deman- 
da una prueba o subprueba. Spearman (1923) 
cscribid que: “Asf, estos grupos neuronales pue- 
den funcionar como maquinarias opcionales a 
las que cl suministro comun de energfa puede 
distribuirse de manera alternativa". 

Spearman consideraba que algunas prue¬ 
bas tenfan elevadas cargas del factor g, mien- 
tras otras —en especial las medidas puramente 
sensoriales— representaban principalmente un 
factor especffico. Dos pruebas que tengan car- 
gas elevadas de g deberfan correlacionarse en 
gran medida. En contraste, las pruebas psico- 
Idgicas no saturadas con g deberfan mostrar una 
correlacidn minima entre sf. Gran parte de la 
invcstigacidn de Spearman sc dirigid a demos- 
trar la veracidad de cstas proposiciones bdsi- 
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cas dcrivadas de su teorfa. En la figura 5-2 se 
ilustran dc manera grdftca estos conceptos; cada 
cfrculo rcprcsenta una prueba dc intcligcncia y 
el grado dc supcrposicidn cntre los cfrculos in- 
dica la fortaleza de la correlaci6n. Obsdrvesc 
que A y B, cada una con cargas elevadas de g, 
se correlacionan en gran medida. Las pruebas 
C y D tienen cargas dibiles en g y, en conse- 
cuencia, no se correlacionan bien. 

Spearman (1923) crefa que las diferencias 
individuales en g se reflejaban de manera mds 
dirccta en la capacidad para utilizar tres princi- 
pios de la cognicidn: aprehensidn de la expe¬ 
rience, educcidn de relaciones y educcidn dc 
correlaciones. Incidentalmente, el tlrmino 
educcion, que se utiliza muy poco, se refiere al 
proceso de comprender las cosas. Estos tres 
principios pueden explicarse al examinar la 
manera en que se resuelven analogfas del tipo 
A:B::C:?; es decir, A es a B, como C es a? Un 
ejemplo sencillo podrfa ser MARTILLO: 
CLAVO::DESTORNILLADOR:? Para resol¬ 
ver esta analogfa, primero debc pcrcibirse y 
comprenderse cada tlrmino con base en la ex¬ 
perience pasada; es decir, debe tenerse apre- 
hensidn de la experiencia. Si no se ticne idea 
de lo que son un martillo, un clavo y un destor- 
nillador, existe muy poca posibilidad de que 
pueda complctarsc la analogfa de manera co- 
rrecta. A continuacidn, debe inferirse la rela- 
cidn entre los primeros dos tlrminos de la 
analogfa, en este caso MARTILLO y CLAVO. 
Mcdiante una frase un tanto ampulosa, 
Spearman se refirid a la relacidn entre dos con¬ 
ceptos como educcidn de relaciones. El paso 


A B CD 


Note: Las pruebas A y 8 tienen una luerle correlacidn, mientras 
C y 0 tienen una correlation debit Vdase texto 


Figure 5-2. Teona de Spearman sobre los dos (actores 
de la Inteligencia. 


final, la educcidn de correlatos, se refiere a l a 
capacidad para aplicar el principio inferido a | 
nuevo dominio, en este caso, aplicar la regia 
inferida para producir la respuesta correcta, et 
decir, DESTORNlLLADOR:TORNILLO.. 

A pesar dc que cn gran medida se han he- 
cho a un lado las especulaciones fisiol6gicas 
dc Spearman, la idea de un factor general ha 
sido tema central en la investigacidn sobre in- 
teligcncia y aun sigue vigente (Jensen, 1979), 
La exactitud del punto dc vista del factor g es 
mds que una cuestidn acadlmica. Si es cierto 
que un factor unico, dominante y general es la 
fuentc esencial de la inteligencia, entonces los 
esfuerzos psicomdtricos por producir sub- 
pruebas factorialmente puras (p. ej., medir la 
comprensidn verbal, organizacidn perceptual, 
memoria a corto plazo, etc.) estdn muy equivo- 
cados. En la medida en que Spearman estl en 
lo correcto, los autores de pruebas deberfan 
evitar la derivacidn de subpruebas y concen- 
trarse en producir una prueba que capture de 
mejor manera el factor general. 

La cuestidn mds diffcil que enfrenta la teo- 
rfa de los dos factores de Spearman es la exis¬ 
tence de los factores grupales. Ya dcsde 1906, 
este autor y sus con tcmporaneos obscrvaron que 
pruebas relativamcnte diferentes podfan tener 
correlaciones mds altas que los valores predi- 
chos a partir de sus respectivas cargas de g 
(Brody y Brody, 1976). Sus descubrimientos 
hicieron surgir la posibilidad de que un grupo 
de medidas di versus pudiera compartir una ca¬ 
pacidad unitaria diferente a g. Por ejemplo, va- 
rias pruebas podrfan compartir un factor unitario 
comun dc memorizacidn que se encontrara a 
medio camino entre el factor g y los diversos 
factores s unicos de cada prueba. Por supuesto, 
la existencia de factores grupales es incompa¬ 
tible con la meticulosa teorfa de Spearman acer- 
ca de dos factores. 


THURSTONE Y LAS HABIUDADES 
MENTALES PRIMARIAS 

Thurstone (1931) desarrolld procedi mientos de 
analisis factorial capaces de buscar matrices 









Pruebas de inteligencia I: Taorma y evaluation preeacokr • 177 



de correlacidn para la existencia de factores 
grupales. Sus m^todos permitfan que un inves- 
ligador descubricra a nivel empfrico el numero 
de factores presentes en una matrix y que defi- 
niera cada factor en tdrminos de las pruebas que 
tenian cargas en 61. En su andlisis de la mane- 
rji en que se correlacionaban entre sf diferentes 
tipos de pruebas intelectuales, Thurstone con- 
cluyd que varios factores grupales amplios —y 
no un solo factor general— podfan representar 
la mejor explicacidn de los resultados empfri- 
cos. En diversos momentos de su carrera de 
investigacidn, Thurstone propuso aproximada- 
mente una docena de factores diferentes. Sdlo 
siete de 6stos se han corroborado con frecuen- 
cia (Thurstone, 1938; Thurstone y Thurstone, 
1941) y se les ha denominado habilidades 
nientales primarias (HMP); son las siguientes: 

• Comprensidn verbal: la mejor medida cs el 
vocabulario, pero esta habilidad tambidn par- 
ticipa en la comprensi6n de lecture y en ana¬ 
logies verbales. 

• Fluidez de palabra: se mide con pruebas como 
anagramas o enunciacidn rapid a de palabras 
dentro de una categorfa dada (p. ej., pala¬ 
bras que comienzan con la letra s). 

• Numero: sindnimo de velocidad y precisidn 
en cdlculos aritmdticos sencillos. 

• Espacio: capacidad para visualizar la manera 
en que se verfa un objeto tridimensional si se 
le girara o desarmara. 

• Memoria asociativa: habilidad en lareas de 
memoria de repeticidn, como el aprendizajc 
de pares asociados de elementos sin relacidn. 

' Velocidad perceptual: participa en tareas sen- 
cillas de cardcter menor, como busqueda de 
semejanzas y diferencias en dctallcs visualcs. 

• Razonamiento inductivo: las mejores medi- 
das de este factor implican el hallazgo de una 
regia, como en una prueba de terminacidn de 
una scrie de numeros. 


riormente reconocid que sus habilidades men- 
tales primarias se correlacionaban de manera 
moderada entre sf, lo cual probaba la existen¬ 
cia de uno o mis factores de segundo orden. 
Por ultimo, Thurstone reconoci6 la existencia 
de g como factor de primer orden. Para esc 
momento, Spearman habfa admitido la existen¬ 
cia de factores grupales que representaban ca- 
pacidades especiales, y se hizo evidente que las 
diferencias entre Spearman y Thurstone eran 
en mayor medida una cuestidn de dnfasis 
(Brody y Brody, 1976). Spearman continud cre- 
yendo que g era el principal determinante de 
las correlaciones entre puntuacioncs de prueba 
y asignd una funcidn menor a los factores 
grupales. Thurstone invirtid estas prioridades. 

P. E. Vernon (1950) proporciond una re- 
conciliacidn entre estas dos perspectives al 
proponer una teorfa de factores grupales jerdr- 
quicos. Desde su punto de vista, g era un factor 
singular al tope de una jerarqufa que inclufa dos 
factores grupales mayores, llamados verbal- 
cducativo (V:ed) y pr&ctico-mecdnico-espacial- 
ffsico (k:m). Debajo de estos dos factores gru¬ 
pales principales se encontraban varios factores 
grupales menores semejantes a las HMP de 
Thurstone; los factores especfficos ocupaban 
la parte inferior de la jerarqufa (figura 5-3). 

El andlisis de Thurstone sobre las HMP atin 
influye en el desarrollo de pruebas. Schaie 
(1983,1985) ha revisado y modificado la Prue¬ 
ba de Habilidades Mentales Primarias y utilizd 
estas medidas en un estudio longitudinal de 
enorme influencia acerca de la inteligencia en 


Factores grupales 
principales 


V:«d K:m 

Factores grupales | - p |—| | ‘| —| | 

secundarios fi ri I m H n - ! I r -1 -! 

II 


secundarios 
Factores especiticos 


Thurstone (1938) publied la Prueba de Habili¬ 
dades Mentales Primarias, que constaba de va- 
has subpruebas independientes disehadas cada 
una para medir una HMP. No obstante, poste- 


Flgura 5-3. Teorfa de la inteligencia de Vernon sobre 
los factores grupales jerarquicos. 

Fuente: Relmpreso con autorizackJn de Vernon, P. E. 
(1950) The structure ol human abilities. Londres: 
Methuen. 
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el adulto. Si la inleligencia fuera principalmcnte 
una cuestidn de g, entonces los factorcs 
gru pales debenan cambiar aproxi mad amen te en 
la misma proportion a medida que se envcje- 
ce. En apoyo al enfoque de los factorcs grupales 
para cl examen intelectual, Schaie (1983) in- 
forma que algunas HMP mucstran poca dismi- 
nucidn relacionada con la edad (Comprcnsi6n 
verbal, Fluidez de palabra, Razonamicnto 
inductivo), mientras olras disminuyen de ma- 
ncra m4s idpida en la vejez (Espacio, Nume- 
ro). Asf. pueden existir razones prdcticas y 
realistas para informar de factorcs grupales 
y no condensar toda la inleligencia en un solo 
factor general. 


R. CATTELL Y LA D|STlNCl6N ENTRE 
INTELIGENCIA FLUIDA/ 

CRISTALIZADA 

Raymond Cattell (1941, 1971) propuso una 
cdlebre teorfa acerca de la estructura de la intc- 
ligencia que John Horn (1968, 1994) revis6 y 
amplid. Como ocurrid con sus antecesores, 
Cattell y Horn utilizaron el an&lisis factorial para 
estudiar la estructura de la inleligencia. No obs¬ 
tante, en vez de encontrar un solo factor gene¬ 
ral o una media doccna de factorcs grupales, 
idcntificaron dos factorcs principales que de- 
nominaron inleligencia fluids (gp e inteligen- 
cia cristalizada (g^). 

La inteligencia fluids es primordialmente 
un tipo de eficiencia mental no verbal y relati- 
vamente independiente de la cultura. Se rela- 
ciona con la capacidad inherente de la persona 
para aprender y resolver problemas. En esc sen- 
tido, la inteligencia fluida se utiliza cuando una 
tarea requierc adaptacidn a una situacidn nue- 
va. En contraste, la inleligencia cristalizada 
rcprcsenta aquello que se ha aprendido a travds 
de la aplicacidn de la inteligencia fluida en 
entomos culturales (p< ej„ el aprendizaje de dl- 
gebra en la escuela). La inteligencia cristaliza¬ 
da depende principalmcnte de la cultura y se le 
utiliza para tareas que rcquieren una respucsta 
npreudida o habitual. Dado que dsta surge cuan¬ 
do la inteligencia fluida se aplica a los produc- 


tos culturales, sc esperarfa que estos dos tipoj 
de inteligencia estuvieran correlacionados. De 
hecho, es comun encontrar que las medidas d e 
inteligencia cristalizada y fluida se corrclacio.. 
nen de manera moderada (r = .5). 

Las habilidades que componcn la intelig en . 
cia fluida son no verbalcs y no dependen mu- 
cho de la exposici6n a una cultura espeeffica, 
Por estas razones. Cattell (1940) consideraba 
que las medidas de este tipo de inteligencia eran 
independientes de la cultura. Con base en estj 
suposicidn, disend la Culture Fair Intelligence 
Test, CFIT (Prueba de Inteligencia Culturalmente 
Justa) como un intento por climinar el prejuj. 
cio cultural en las pruebas. Por supucsto, llamar 
culturalmente justa a una prueba no ncccsajja- 
mente hace que lo sea. De hecho, el objetivo 
de lograr una prueba de inteligencia que sea 
independiente por completo de la cultura ha 
resultado ser esquiva. En el Tema 6B. Pruebas 
grupales de inteligencia, sc analiza con mayor 
dctalle el tema de la CFIT. 

En versiones posteriores de la teorfa dc la 
inteligencia fluida/cristalizada, Cattell (1971) 
y Hom (1982, 1994) aumentaron y claboraron 
los conceptos que se analizaron antes. En la 
actualidad, serfa mejor considerar su enfoque 
como una teorfa de intcligencias multiples, pero 
la divisidn dc g / -g f sc ha vuelto tan conocida 
que no serd fScil eliminarla. En sus ultimas re- 
visioncs, los autores han propuesto un modelo 
jerirquico, entremezclado, de la inteligencia, 
con los components fluido y cristalizado en la 
parte superior. Estas habilidades tienen subor- 
dinados diversos componcntcs idcntificados de 
la inteligencia, que incluyen otganizacidn vi¬ 
sual. velocidad perceptual, oiganizacidn auditi- 
va, varias capacidades de memoria, asf como 
componentes espccfficos de rcccpci6n senso¬ 
rial. El modelo revisado es diffcil y los lectores 
intcresados deberfan consultar a Hom (1994). 

PIAGET Y LA ADAPTACldN 

El psicdlogo suizo Jean Piaget (1896-1980) 
clabord una teorfa del desarrollo cognitivo que 
tiene varias implicaciones para el diseho de 
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priiebas de inteligencia infantil (Ginsburg y 
Opper, 1988). Piaget (1926, 1952, 1972) utili- 
eniicvistas y pruebas informnles con nifios 
p#ra desarrollar unn serie de punios dc vista pro- 
yocalivos y revoiucionarios accrca del dcsarro- 
Hointelectual. Su nueva perspectiva inclufa los 
stjjuienlcs clcmcntos: 

• El pensnmiento infantil es cualitativamentc 
difcrentc del pensnmiento adulto. 

• Las estrueturas psicoldgicas dcnominadas 
esqucmas son la base principal para la ob- 
tcnci6n dc conocimicnto nuevo accrca del 
mundo. 

• Se pueden identificar cuairo ctapas del desa- 
rrollo cognitivo. 

A continuacidn se examinan con mayor dctalle 
cada uno de estos puntos. 

A travds del cstudio del dcsarrollo de la 
conscrvacidn, Piaget concluyd que el nifio cons- 
truye su concepto del mundo dc mancra funda¬ 
mental mente diferente a la perspectiva adulta. 
La conservacion se reficre a la conciencia dc 
que las cantidudes ffsicas no cambian cuando 
se les altera de modo superficial cn su aparien- 
cia. Por ejemplo, la mayorfa dc los adultos sa- 
ben que dos filas igualcs de 10 monedas de un 
centavo siguen siendo cquivalcntes aunque 
una de las filas se disperse —posecn conserva- 
cidn dc numero. Pero serd fdcil que un nino pe- 
querio sc engane por el cambio aparente, y es 
posible que insista cn que la segunda fila tiene 
ahora mds monedas. De manera similar, se pue- 
de mostrar que los nifios pequenos no poseen 
conscrvacidn de una cantidad, materia, peso o 
volumcn continuos. 

A fin dc explicar c6mo obtienen los lac- 
tantes y nifios el conocimiento nuevo acerca del 
mundo, Piaget sugirid que forman estrueturas 
psicoldgicas denominadas esquemas. Un cs- 
quema es un patrdn organizado de conducta o 
una cstructura mental bicn definida que condu¬ 
ce al conocimiento de edmo se hacen las cosas. 
Quizds unos cuantos ejemplos ayuden a acla- 
nu cste diffcil concepto. Los lactantes poseen 
esquemas que tienen una naturalcza principal- 
mente sensoriomotora, corno asir y tirar, que 


permite a un bebd tomar el objeto dcseado y 
llevdrselo a la boca. A medida que crcce, se 
aiiaden estrueturas mentales al conjunto de es¬ 
quemas sensoriomotores. Por ejemplo, los ado- 
lescentes posecn, cn tdrminos generales, cl 
esquema de alfabetizacidn que les permite en- 
contrar una palabra en un diccionario median- 
te la aplicacidn repetida de la sencilla regia de 
que las palabras se localizan en orden alfabdtico 
por la primera letra, despuds la segunda y asf 
sucesivamente. 

El genio de Piaget se encucntra en su su- 
gerencia del mccanismo a travds del cual 
evolucionan los esquemas hacia ni velcs de com- 
plejidad cada vez mayores, que se trasforman 
de esa manera en el nivel mds maduro de habi- 
lidad intelectual que se observe en la mayorfa 
dc los adultos. Este mccanismo se conoce como 
proccso de equilibracidn. Para comprender 
este proccso, cl lector necesita conocer tres 
conceptos piagetianos adicionales: asimilacidn, 
acomodacidn y equilibrio. 

La asimilacion es la aplicacidn dc un es¬ 
quema a un objeto, persona o acontecimiento. 
Por ejemplo, la asimilacidn participa cuando un 
lactantc emplea el esquema de asir y tirar para 
tomar una sonaja y llevArsela a la boca. Si la 
asimilacidn funciona para lograr las metas de- 
seadas por la persona, se presenta un estado de 
armonfa o equilibrio, pero, ^qud sucede si la 
aplicacidn de un esquema no funciona? Supdn- 
gase que el esquema de asir y tirar no tiene dxi- 
to porque la sonaja del nino se engancha en las 
barras verticales de la cuna en el momento en 
que dstc trata de llevarse el juguete a la boca. 
Surgird cntonccs un estado de tensidn dindmi- 
ca que requiere que el nifio ajuste su esquema 
para que funcione. La adaptacidn dc un esque¬ 
ma fallido para que funcione se denomina 
acomodaddn. En el ejemplo del lactantc, el 
esquema podrfa modificarsc y volverse un es¬ 
quema dc asir, tirar y girar. Si el esquema mo- 
dificado funciona y le permite al lactante llevarse 
la sonaja a la boca, existc de nuevo un estado 
de equilibrio. Vdase la distincidn entre equili¬ 
brio, estado dc armonfa temporal y equili¬ 
bracidn, cl proccso completo de asimilacidn, 
acomodacidn y equilibrio. Piaget consideraba 
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que la busqueda del equilibrio era una caractc- 
nstica inherence del ser humano. 

Este autor tambien propuso cuatro etapas 
del desarrollo cognitivo. Segun su perspectiva, 
cada elapa es cualitativamente diferente de las 
otras y se caracteriza por patrones caracterfsti- 
cos de pensamiento (cuadro 5-2). En el tcma 
5B, Evaluacidn de las capacidades de lactantes 
y preescolares. se analiza una prueba para 
lactantes basada cn un anilisis piagetiano del 
desarrollo cognitivo. En general, las pruebas 
basadas cn estos conceptos buscan valorar si 
un nino ha superado ciertos hitos cognitivos (p. 
ej., conservacidn de volumen) propuestos por 
Piaget. 

GUILFORD Y EL MODELO 

DE LA ESTRUCTURA INTELECTUAL 

Despuds de la segunda Guerra Mundial, J. P. 
Guilford (1967, 1985) continud con la btfsque- 
da de los factores de la inteligencia que habfa 
iniciado Thurstone. En poco tiempo, Guilford 
concluyd que el numero de habilidades mcnta- 
les discemibles era mucho mayor que las siete 


propuestas por Thurstone. En primer luga r 
Thurstone habfa ignorado por completo la ca- 
tegorfa de pensamiento creativo, un descuido 
injustificable desde el punto de vista de Guilford 
Tambidn encontr6 que si inclufa tipos innova, 
dores de pruebas dentro de las grandes baterfas 
que aplicaba a los individuos, entonces el patrfa 
de correlaciones entre estas pruebas indicaba 
la existencia de, literalmente, docenas de nuevo* 
factores del intelecto. Lo que es mis, Guilford 
se dio cuenta de que algunos de estos nuevos 
factores tenfan semejanzas recurrentes con res- 
pecto a los tipos de procesos mentales implica- 
dos, los tipos de informacidn mostrados o la 
forma que asumfan los reactivos de informa- 
ci6n. Como resultado de estas semejanzas rc- 
currenies en los factores recidn dcscubiertos del 
intelecto, Ileg6 a la conclusidn de que estos fac¬ 
tores multitudinarios podfan agruparse cn un 
pcqucfio numero de dimensiones principales. 
Guilford (1967) propuso un elegante modelo 
de la estructura intelectual (El) para resumirsus 
resultados. Concebido en tdrminos visuales, el 
modelo de El de Guilford clasifica a las habi¬ 
lidades intelectuales en ties dimensiones denomi- 
nadas opcraciones, contenidos y productos. 


Cuadro 5-2. Etapas del desarrollo cognitivo segun Piaget 


Etapa y rango de edades 

Sensoriomotofa: 
nacimiento a los 2 anos 


Preoperacional: 
2 a 6 aflos 


Operaclonos concretes: 
7 a 12 aftos 


Caracterfstlcas del pensamiento 

Los lactantes experlmentan al mundo prlncipalmente a travis de sus 
sentidos y capacidades motoras, actuan como si un objeto dejara de 
exlstir cuando no esti ante su vista, pero desarrollan permanenda 
de 6ste al final de este estadio. 

No se desarrollan aun los conceptos de conservackta, pero estos niftos 
comprenden la idea de una retaddn luncional —por ejemplo, se lira de 
un cordel para abrir una cortina y entre mis se lira de 61, mis se abre la 
cortlna. Tambien se desarrolla lacapacidad para simbofizar mentalmenle 
las cosas con palabras e imigenes. 

Por lo comun, los niftos desarrollan conservaclbn y demuestran capa¬ 
cidades llmitadas de razonamiento Idgico. Por ejemplo, se desarrolla el 
concepto de reversibilidad —el conocimiento de que una accidn puede 
revertir o negar a otra. 


Operaclonos formates: En general en esta etapa se desarrolla la solucidn slstemitica de los 

12 afios en adeiante problemas que se asocian con el pensamiento adulto. Existe mayor 

capacidad para generar hipdtesis y someterlas a prueba. 
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Por operacioncs. Guilford tenfa en mente 
e | upo de operacidn inlelcctual quc rcquicrc la 
nnjeba. La mayor parte de los reacti vos enfatiza 
s6lo una de las operaciones enumeradas aquf: 


Cognicidn Descubnr. entcnder o comprendcr. 

Memoria Iniroduccion de los reactivos de 

informacidn a la memoria, como 
en el caso de una serie de numeros. 


Produce idn 
divergente 

Produccidn 

convergente 

Evaluacidn 


Recuperar de la memoria los reac¬ 
tivos de una clase cspecffica, como 
nombrar objetos comestibles o no. 
Rccupcracidn de la memoria de un 
reacti vo correcto, como en el caso 
de una palabra para un crucigrama. 
Determinar qud tan bien satisfa- 
ce un cierto reactivo de informa- 
cion requisitos Idgicos especfficos. 


Contenidos se refiere a la naturaleza de los 
materiales o informacidn presentados a la per¬ 
sona evaluada. Las cinco categories de conte- 
nido son las siguientes: 


Visual 

Auditivo 

Simbdlico 

Semantico 

Conductual 


Imigenes presentadas a los ojos. 
Sonidos presentados a los ofdos. 
Como en el caso de sfmbolos ma- 
lem&ticos que representan algo. 
Significados, en general sfmbolos, 
de palabras. 

La capacidad para comprcnder el 
estado mental y conducta de otras 
personas. 


La tercera dimension en el modelo de Guilford, 
productos, se refiere a los diferentes tipos de 
estructuras mentales que debe producir el cere- 
bro para obtener una respuesta correcta. Los seis 
tipos de productos son los siguientes: 

Unidad Una entidad singular que tiene 
una combinacidn umca de propie- 
dades o atributos. 

Clase Aquello que tienen en comun las 

unidades similares, como en un 
conjunto de tridngulos o de soni¬ 
dos con tonos altos. 


Relacidn Una conexidn observada entre dos 
reactivos, como dos tonos con una 
separacidn de una octava. 

Sistema Tres o mSs reactivos que forman 
un todo reconocible, como en una 
melodfa o en un plan para una sc- 
cuencia de acciones. 


Transfor- Un cambio en un reactivo de in- 
macidn formacidn, como en el caso de una 

correccidn para un error de orto- 
graffa. 

Implicacidn Lo que implica un reactivo indi¬ 
vidual, como la expectativa de un 
trueno despuds de un rayo. 


Asf, Guilford (1985) identified cinco tipos de 
operacioncs, cinco tipos de contcnido y seis ti¬ 
pos de productos, para un total de 5 x 5 x 6 o 
150 factores del intelecto. Cada combinacidn 
de una operacidn (p. cj., memoria), un contenido 
(p. ej., simbdlico) y un producto (p. cj., unida- 
dcs) representa un factor diferente del intelec¬ 
to. Guilford afirma haber verificado m£s de 100 
de estos factores en su investigacidn. 

Con frecucncia se alaba al modelo de la El 
por considcrar quc capta las complejidades de 
la inteligencia. No obstante, dste tambidn es un 
taldn de Aquiles potencial para la teorfa. Con- 
siddrese un factor del intelecto, la memoria de 
unidades simbdlicas. Una prueba que requiere 
que el examinando recuerde una serie de dfgitos 
hablados (p. ej., Retencidn de dfgitos del 
WA1S-III) podrfa captar bastante bien este fac¬ 
tor del intelecto. Pero de la misma manera po¬ 
drfa lograrlo una prueba visual de retencidn de 
dfgitos y quizd tambidn una prueba an£loga con 
la presentacidn tdctil de sfmbolos, como en cl 
caso de rodillos vibratorios aplicados a la piel. 
Quizd sea necesario tener un cubo separado para 
audicidn, visidn y tacto; de tal manera que un 
modelo ampliado incorporarfa 450 factores del 
intelecto, lo cual con toda seguridad es un mi- 
mero pesado y diffcil de manejar. 

Aunque parecc dudoso que la inteligencia 
pudiera implicar un numero tan grande de ca- 
pacidades unicas, de todas maneras la perspcc- 
tiva atomista de Guilford ha provocado quc los 
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autores de pruebas reconsideren y amplfen su 
comprcnsidn acerca de la inteligencia. Antes 
de las contribuciones de Guilford, la mayor 
parte de las pruebas de inteligencia requerfan 
principalmentc de la produccidn convcrgcnte 
—la construcci6n de una sola respuesta correcta 
para una situacidn estfmulo. Guilford hizo sur- 
gir la fascinante posibilidad de que la produc¬ 
tion divergente— la creacidn de numerosas 
respuestas apropiadas para una sola situacidn 
estfmulo —tambidn sea un elemento cscncial 
de la conducta inteligcntc. Asf, una indicacidn 
como ‘‘enumere tantas consccucncias como sea 
posible de que las nubes tuvieran cucrdas col- 
gando de ellas” (produccidn divergente), podrfa 
evaluar un aspecto de la inteligencia que no se 
mide a travds de las pruebas tradicionales. 

TEORfA DEL PROCESAMIENTO 
SIMULTANEO Y SUCESIVO 

Algunos de los conceptos actuales de la intcli- 
gencia estdn en deuda con las investigacioncs 
neuropsicoldgicas del psicdlogo ruso Aleksandr 
Luria (1902-1977). Luria (1966) se bas6 pri- 
mordialmente en cstudios sobre casos indivi¬ 
duates y en observaciones clfnicas de soldados 
con lesiones cerebrales para llegar a una teorfa 
general del procesamiento cognitivo. El nikleo 
de su teorfa es el siguiente: 

Los andlisis muestran quo existe (uorta eviden¬ 
ce para dislingulr dos tlpos bastaos de actividad 
Integradora de la corteza cerebral modiante las 
cuales pueden reRejarse diforenles aspectos dot 
mundo exterior... La prlmera es la integracidn de 
los estlmulos individuales que llegan al cerobro 
en grupos simultdneos y prlncipalmente es- 
paciales, y la sogunda es la Integracidn de los 
estfmulos individuales que llegan de manera con- 
secutiva al cerebro en series sucesivas, organi- 
zadas en sentido temporal (Luria, 1966). 

Dado que cste enfoque sc centra en la meedni- 
ca a travds de la cual se procesa la informa- 
cidn, con frecuencia se le conoce como teorfa 
del procesamiento de informacidn. 

El procesamiento simult&neo de la infor- 
macidn se caracteriza por la ejecucidn simultd- 


nea de difcientes operaciones mentales. Los tj. 
pos de pcnsamienlo y perccpcidn que regiifjl 
ren del andlisis cspacial, como el dibujo dc uq 
cubo, ncccsitan del procesamiento simultdneo 
de informacidn. En el dibujo, la persona eva- 
luada debe pcrcibir de manera simultdnea la 
forma general y guiur su mano y dedos en la c je- 
cucidn de la forma. Un enfoque secucncia] 
para cl dibujo dc un cubo (si al me nos cso fiiera 
posible) serfa horriblemcnte complejo. En efec- 
to, el exaininnndo tendrfa que dibujar Ifneas in- 
dividuales de longitudes y orienlaciones 
angulares sumamente especfficas y esperar que 
todo sc alincara. En auscncia de una gestalt 
mental simultdnea que gufc cl dibujo, casi es so- 
guro que sc obtenga una produccidn distorsio- 
nada. Luria descubrid que el procesamiento 
simulidnco se rclaciona con los Idbtilas occipital 
y parietal cn la parte trasera del cerebro. 

El procesamiento succsivo dc la informa* 
cidn es necesario para nctividadcs mentales on 
las que debe seguirse una secucncia apro|)iada 
de operaciones. Se encucntra en agudo conlrastc 
con el procesamiento simultdneo (como cn cl 
dibujo), para el que la secucncia no ticne im- 
portancia. El procesamiento succsivo es nece¬ 
sario para rccordar una serie dc dfgitos, repelir 
una cadena de palabras (p. ej., zapato, pclota, 
huevo) y para imitar una scrie dc raovimienttM 
con la mano (pufio, palma, pufio, puno, paima). 
Luria localizd el procesamiento succsivo en el 
Idbulo temporal y cn las regiones frontales cer- ‘ 
canas a dste. 

La mayor parte de las formas de procesa* ] 
mientode informacidn requieren de inlcraccidn 
de mccanisrnos simoltnneos y succsivos. Das 
(1994) cita cl cjemplo de la lcctura dc una pala* 
bra desconocida como tadturno: 

Oeben reconocersa las lotras indivldualos y eso 
implies la codlficncibn sltnulianea El loctor equl- 
para la forma visual de la letra con un diccionario 
menial y obllene el nombre para ella. Entonces, 
ban de formarso las secuencias de lotras (codifi* 
cacibn sucesiva) y comblnarse como una silaba 
(simultdnea). Despuds la cadena de sflabas debe 
convertirse en una palabra (sucesiva), rocono* 
corse la palabra (simultdnea) y luogo armarse un 
programs de pronunclacibn (sucesiva), lo cual 
conduce a la lectura oral (sucesiva y simultdnea). 
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nas admite quc csto pucde rcpresentar una 
oeispectiva simple de lo que ocurre cuando un 
lector se enfrenta con una palabra. El punto 
csencial es que cl procesamiento de informa- 
cidn de nivcl superior depende de la intcraccion 
de formas especfficas, anatdmicamente loca- 
lizablcs, de procesamiento dc informacidn. 

El rcto dc un cnfoque simult&neo-sucesivo 
para la evaluacidn dc la inteligencia consiste 
endisenar tareas que detectcn formas rclativa- 
rncnte puras de cada enfoque de proccsamien- 
[0 de informacidn. Las pruebas que emplcan 
esta estrategia son la Batcrfa Kaufman de Eva- 
luacidn para Ninos (K-ABC), que se analiza en 
el siguiente lema, y el Das-Naglieri Cognitive 
Assniessment System (Sistcma de Evaluacidn 
Cognitiva Das-Naglieri; Das y Naglieri, 1993). 
La batcrfa Das-Naglieri incluye tareas sucesi- 
vas que implican cnunciacidn riipida (como 
“Diga pan, sol, col tan rdpido como le sea po- 
sible en 10 ocasiones") y medidas simultdneas 
tamo de tareas verbales como no verbales; lam- 
bidn evalua la planificacidn y atencidn, lo cual 
conduce a las siglas PASS (planificacidn, aten¬ 
cidn. simultdneo, sucesivo; Das, Naglieri y 
Kirby, 1994). 

INTELIGENCIA COMO CONSTRUCTED 
BIOL6GICO 

l.o mayorfa de los investigadores han estudia- 
do la inteligencia de manera tradicional al dc- 
sarrollar pruebas del intelecto y correlacionar 
las puntuaciones con criterios extemos (p. ej., 
calificaciones escolares) u otros resultados de 
una prucba. Pero algunos han buscado compren- 
der la naturaleza dc la inteligencia al examinar 
las propiedadcs del cerebro en sf. Por ejemplo, 
Hynd y Willis (1985) proporcionaron un cxce- 
lente estudio dc los fundamentos neuroldgicos 
dc la inteligencia. 

Una propiedad importante del cerebro, la 
cual se requiere para la conducta intcligcnte, cs 
la actividad eldctrica sincronizada y con un 
patrdn adccuado de las cdlulas cerebrales. Las 
neuronas debcn trasmitir impulsos electroquf- 
micos calibrados de manera precisa a fin de quc 


ocurran la scnsacidn, percepcidn y los proce- 
sos superiores de pensamiento. La actividad 
eldctrica colectiva de las neuronas puede me- 
dirse colocando electrodos en el cuero cabellu- 
do de la persona. El registro continuo de la 
actividad cldclrica muestra fluctuaciones cspon- 
Uincas a lo largo del tiempo, pero tambidn de- 
muestra patrones predecibles en respucsta a 
ciertos estfmulos. Por ejemplo, se puede medir 
un potencial cvocado al observar el patrdn dc on- 
das cerebrales que ocurren en un cuarto dc sc- 
gundo mds o menos despuds de quc se cnciende 
una luz ante los ojos de un individuo. En gene¬ 
ral, el potencial evocado promedio (PEP) se 
obliene de cientos de dichos ensayos con una 
sola persona. Dc esta manera puede obtenerse 
un patrdn sumamente consistentc y distintivo 
para cuaJquier individuo. 

Ertl y Schafer (1969) se cncuentran entre 
los primeros investigadores que cstudiaron los 
correlatos en ondas cerebrales dc la inteligen¬ 
cia. Estos autores descubrieron que la forma de 
la onda en el PEP tienc mis picos y vallcs en cl 
caso de individuos con Cl elevado que en el de 
aquellos con Cl bajo. Eysenck (1982) publied 
dcscubrimientos similarcs que sc reproduccn en 
la figura 5-4. Dos colaboradores dc Eysenck, 
A. E. Hendrickson (1982) y D. E. Hendrickson 
(1982), senalaron que la longitud total de la 
forma sinuosa de la onda en el PEP podfa utili- 
zarse como fndice bioldgico de la inteligencia. 
Colocaron un trozo de cordel sobre cada una 
de las formas de onda del PEP informadas por 
Ertl y Schafer (1969). Cortaron el inicio y fin 
de los cordeles, los extendieron dc manera fir- 
me para formar lfncas rectas y despuds midie- 
ron su longitud. Entonccs, los investigadores 
pudicron calcular la correlacidn entre las lon¬ 
gitudes de los cordeles y las puntuaciones 
publicadas de Cl. El resultado fue un impresio- 
nante valor de r =.77. Esta correlacidn es tan 
elevada como aqudllas informadas cntie cua- 
lesquiera dos pruebas psicomdtricas dc intcli- 
gcncia. Una medida puramentc bioldgica de la 
funcidn cerebral (ondas del PEP) results scr un 
excelcnte mecanismo dc prediccidn de la inte¬ 
ligencia como se mide a travds de pruebas tra- 
dicionales de CL 
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FIgura 5-4. Formas de onda del potoncial evocado promedio (PEP) para personas con Cl alto y bajo. 

Fuante: Reproducido con autorizackSn de Eysenck, H. J. (1982). A modal lor Intelligence. Heidelberg: Spring*. 
Ulillzado con autorlzaddn de Springer Publishing Company Inc., 536 Broadway. Nueva York, NY 10012. 


A pesar de estos resultados prometedores 
de la invcstigacidn, varios estudiosos continuan 
mostrindose escdpticos acerca de los correlates 
electrocorticales dc la inteligencia. Las corre- 
laciones surgen s61o bajo ciertas condicioncs y 
los intentos por replicar los resultados no siem- 
pre tienen dxito (Eysenck, 1994; Vernon y Mori. 
1990). Gale y Edwards (1983) insisten en que 
los estudios de correlacidn no son suficientes; 
es neccsaria una orientacidn mis ligada a la teo- 
rfa que vincule la inteligencia como rasgo con 
el procesamiento de informacidn a nivel neu¬ 
ronal. Se han hecho intentos por formular una 
teorfa de este tipo (Deary, Hendrickson y Bums, 
1987). fistos y otros estudios similares (p. ej., 
Shucard y Horn, 1972) sirven para recordar que 
la inteligencia se encuentra ligada de alguna 
manera a las propiedades fisioldgicas del cere- 
bro, aunque no se comprenda aun la caracterfs- 
tica bioldgica precisa que la explica. 

Haier y sus colaboradores han seguido una 
vfa diferente en su estudio acerca de la inteli¬ 
gencia bioldgica (Haier, Nuechtcrlein, Hazlett 


y col., 1988; Haier, Siegel, Tang y col., 1992), 
Estos investigadores midieron las tasas metabd- 
licas de la glucosa cortical, como se revcla a 
travds de los anilisis con tomografia por emi- 
sidn de positrones (TEP), de voluntarios que 
resuelven problemas intelecluales. Las ncuronas 
utilizan glucosa y oxfgeno como combustible, 
de modo que una TEP revelari “puntos calien- 
tes" en la mayor parte de las zonas cerebrales 
activas (donde la glucosa se metaboliza). Un 
resultado fascinante es que las personas mis 
inteligentes mostraron una menor actividad 
cerebral al momento de resolver problemas de 
analogfas geomdtricas y cuando jugaban el jue- 
go de computadora Tetris, que aqudllas menos 
inteligentes. Lo que aiin es poco claro en esta 
Ifnea de investigacidn es la dircccidn causal: 
r,las personas son inteligentes porque utilizan 
menos glucosa o la usan menos porque son in¬ 
teligentes? Otra posibilidad es que tanto el Cl 
elevado como el bajo metabolismo de la gluco¬ 
sa se encuentren relacionados con una tcreera 
variable causal (Sternberg y Kaufman, 1998). 
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GARNER Y LA TEORtA naturales: lingUfstica. ldgico-matemdtica, espa- 

p E las inteligencias multiples cial, musical, corporal-cincstdsica, interpersonal 

e intrapersonal. Tres de estos siete tipos de in- 


Hovvard Gardner (1983,1993) ha propuesto una 
teorfa de las inteligencias multiples basado de 
manera aproximada en el estudio de las rela¬ 
tes cerebro-conducta. Afirma que existcn 
varias inteligencias humanas relativamente in- 
dependientes, aunque admite que aun no se han 
establecido en definitiva la naturaleza, grado y 
ndmero exactos de las inteligencias. Gardner 
(1983) esboza de la siguiente manera los crite- 
nos para una inteligencia autdnoma: 

• Aislamiento potencial por dano cerebral —la 
lesion cerebral puede haber destruido, o pro- 
tegido por aislamiento, la facultad. 

• La existencia de individuos excepcionales, 
como los autistas sabios —la facultad queda 
particularmentc protcgida en medio de la 
mcdiocridad intclcctual. 

• Operaciones centrales identificables —la fa¬ 
cultad depende de una o mas operaciones bd- 
sicas de procesamicnto de informacidn. 

• Historia distintiva del desarrollo —la facultad 
posec una historia de desarrollo identificable 
que quizd incluya periodos criticos e hitos. 

• Admisibilidad evolutiva —aunque esto se en- 
cuentra a nivel especulativo, una facultad 
debe tener antecedentes evolutivos que com- 
parta con otros organismos (p. ej., la organi- 
zacidn social de los primates). 

• Sustcnto de la psicologia experimental —la 
facultad surge en estudios de laboratorio de 
psicologia cognitiva. 

• Sustento de dcscubrimientos psicomdtricos 
—la facultad se revela en estudios de medicidn 
y es susceptible a la mcdicidn psicomdtrica. 

•Susccptibilidad para la codificacidn simbdli- 
ca —la facultad puede comunicarse a travds 
de sfmbolos, incluyendo (aunque no limitado 
a) lenguaje, representacidn pictdrica y mate- 
ndticas. 

Con base en estos criterios, Gardner (1983, 
1993) propone que se han confirmado de ma- 
ncra sustancial las siguientes siete inteligencias 


teligencia son muy conocidos —lingUfstica (es 
decir, verbal), 16gico-matemdtica y espacial— 
y se han disehado numcrosas pruebas formales 
para mcdirlas, de modo que aquf no sc disculird 
mils accrca de cllas. Las otras cuatro variacioncs 
de inteligencia son en cierto modo novedosas 
y, por lanto, requieren de una presentacidn mds 
detallada. 

La inteligencia corporal-cinestdsica inclu- 
ye los tipos de habilidades que utilizan los atletas, 
bailarines, mimos, mccanografos o cazadores 
“primitivos”. Aunque por lo general las cultu- 
ras occidcntalcs sc muestran rcacias a considcrar 
al cuerpo como un tipo de inteligencia, cste no 
es el caso en gran parte del resto del mundo, 
como tampoco ocurre asf en la historia evoluti¬ 
va. De hecho, las personas que tenfan habilidad 
para evitar a los depredadores, subirse a los dr- 
boles, cazar animates y preparar herramientas 
estaban en mayor probabilidad de sobrevivir y 
pasar sus genes a generaciones posteriores. 

Las inteligencias personates incluyen la 
capacidad para tener acceso a la propia vida 
emocional (intrapersonal), asf como la de ad- 
verlir y distinguir los estados de dnimo, tempe- 
ramentos, motivaciones e intenciones de los 
demds (interpersonal). Asf, la inteligencia per¬ 
sonal engloba tanto una version intrapersonal 
como una interpersonal. La primera se encuen- 
tra en los grandes novelistas que pueden escribir 
de manera introspectiva acerca de sus senti- 
mientos, mientras la ultima puede observarse 
con frecuencia en Ifderes religiosos y politicos 
(p. ej., Mahatma Gandhi o Lyndon Johnson) que 
pueden desentranar las intenciones y deseos de 
otras personas y utilizar esa informacidn para 
influir sobre cllas y formar alianzas Utiles. 

La inteligencia musical es quizd la menos 
comprendida de las inteligencias de Gardner. 
Las personas con buena inteligencia musical 
aprenden con facilidad a tocar un instrument 
o a escribir sus propias composiciones. Aunque 
el conocimiento de los aspects estructurales 
de la melodfa, ritmo y timbre es importante para 
la inteligencia musical, Gardner sehala que 
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muchos expertos consideran que los aspcctos 
afectivos o cmocionales dc la musica son el ele- 
mcnto central. Este autor considera que cuando 
finalmente se descifren los fundamentos neuro- 
Ibgicos dc la musica, se tendri “una explicacibn 
de la manera en que los factores ernocionalcs y 
motivacionales se encuentran entrelazados con 
aqudllos puramcntc pcrceptuales" (Gardner. 
1983). 

El fenbmeno de los autistas sabios pro- 
porciona un fuerte apoyo para la exislencia de 
inteligencias independientes, incluycndo la in- 
teligencia musical.' Un autista sabio es un 
individuo con retraso mental que tiene un ta- 
lento sumamente desarrollado en una sola area, 
como arte, c&lculo ripido, memoria o musica. 
Un ejemplo es el extraordinario caso de Leslie 
Lcmke, que nacib ciego, con retraso mental y 
parilisis cerebral; no se suponfa que sobrevi- 
viera; su madre adoptiva luvo que persuadirlo 
de que tomara lechc de un biberdn; posterior- 
mente, lo fijd con correas a su propia espalda 
para ayudarlo a aprender a caminar. A pesar de 
sus graves discapacidades, Leslie se enamord 
del piano y mostrd una increfble precocidad 
para sacar melodfas en 61. Despuds dc unos 
cuantos anos, a la edad de 18, pod fa escuchar 
una pieza cldsica de piano una sola vez y des¬ 
pues tocarla sin comcter ningun error (Patton, 
Payne y Beime-Smith, 1986). El lector puede 
encontrar estudios de caso adicionales sobre 
autistas sabios en Miller (1989) y Treffert 
(1989). 

Recientemente, Gardner (1998) ha afiadi- 
do tres candidatas tentativas a su lista de inteli¬ 
gencias. fistas son naturalista, cspiritual y 
existencial. La inteligencia naturalista es del tipo 
mostrado por personas que pueden discemir 
patroncs dentro de la naturaleza. Charles Darwin 
serfa el principal ejemplo de una persona de 
ese tipo. Gardner considera que la evidencia 
para este tipo dc inteligencia es relativamcnte 


' Histbricamcnte, los autistas sabios sc han llamado idlo- 
tas sabios. que se reficre en sentido literal a una per¬ 
sona que al mismo tiempo tiene un reuaso profundo 
y. sin embargo, es un “sabio”. Por razones obvias, se 
ha hccho a un lado cl primer tbrmino. 


fuerte. En contraste, existen pruebas mcnores 
dc que la inteligencia cspiritual (una preocupa. 
cibn accrca dc las cuestiones cdsmicas y espi- 
rituales en el propio desarrollo) y la inteligencia 
existencial (una preocupacibn con cuestiones 
fundamental, incluyendo cl significado dc la 
vida) scan inteligencias independientes. En ge- 
ncral, la teorfa de las inteligencias multiples es 
convincente por su sencillez, pero existe poca 
invcstigacibn empfrica acerca de su validez. 

STERNBERG Y LA TEORIA TRIARQUICA 
DE LA INTELIGENCiA 

Sternberg (1985b, 1986,1996) asumc una pers- 
pectiva mucho mbs amplia acerca de la natura¬ 
leza de la inteligencia que la mayorfa de los 
tebricos anteriorcs. Adcmds de proponer que 
se requieren cicrtos mecanismos mentalcs para 
la conducta intcligcnte, tambibn enfatiza que la 
inteligencia implies adaptacibn al ambiente de 
la vida real. Su teorfa enfatiza lo que 61 deno- 
mina inteligencia exitosa o “la capacidad para 
adaptarse, moldear y sclcccionar los ambientes 
para lograr has propias metas y aqucllas de la 
propia sociedad y cultura” (Sternberg y Kaufman, 
1998, p. 494). 

La teorfa de Sternberg se denomina triar- 
quica (gobemada por ires) porque trata sobre 
tres aspcctos dc la inteligencia: componcncial, 
basada en lacxperiencia y contextual. Cada uno 
de estos (ipos de inteligencia tiene dos o mis 
subcomponentes. La teorfa completa se resu¬ 
me en el cuadro 5-3. 

La inteligencia componcncial consta dc 
los mecanismos mentales intemos responsables 
de la conducta inteligente. Los componentcs de 
la inteligencia satisfacen tres funciones diferen- 
tes. Los mctacomponentes son los procesos 
ejecutivos que dirigen las actividades de todos 
los demis componentes de la inteligencia; son 
responsables de determinar la naturaleza de un 
problema intelectual, seleccionando una estra- 
tegia para rcsolverlo y asegurbndosc dc que se 
lleve a cabo la larca. Los metacomponentes re- 
ciben realimentacibn constante acerca de cbmo 
van las cosas en la solucibn del problema. Las 
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Cuadro 5-3. Resumen de ia teoria 
trlirqulca de la intellgencia de Sternberg 

Intellgencia componencial 
Motacornponenlos o procesos ejecuUvos (p. oj.. 
plnnl(lcacl<in). 

Compononios do ojecucldn (p. ej,. razonamlento 

Sdoglstico). 

Componentes de adquisicldn de conocimionto 
(p. ej., capacidad para adquirir palabras de 
vocabulario). 

Inleligencla basada on la oxporlencla 
Capacidad para onlronlar la novedad. 

Copacldad para aulomatlzar el procesarniento 
de kiformacidn. 

Intellgencia contextual 
Adaptactoo al amblenlo do la vida roal. 

Soloccion de un ambiente adecuado. 

Moldeamienlo del ambienle. 

Fuonln: Resumldo do Sternberg, R J. (1986). InloWgonce 
applied: Understanding and increasing your intellectual skills 
San Olego, CA: Harcourt Brace Jovanovlcli 

personas con una gran capacidad cn cl aspecto 
metacomponcncial dc la intcligencia licncn muy 
bucnos rcsullados para asignar sus rccursos in- 
nectuales. 

En un estudiosobre solucidn dc problcmas 
cn el quc se emplearon formas novedosas dc 
nnalogtas, Sternberg (1981) encontrd que la 
inteligencia superior se retaciona con la utili¬ 
zation dc un tiempo relativamcnlc mayor en 
la planificaci6n global o dc orden superior y 
relativamcnlc mcnos tiempo en la planificacidn 
local o dc orden inferior. Por ejemplo, considd- 
rcse cste problema dc analogfa: 

Hombrc:Picl: (Pcrro. Arbol): (Corteza, Gato) 

El examinando debe elegir los dos Idrminos 
coirccios dc la dcrecha que completarin la ana¬ 
logfa (las opcioncs correclas son drbol y corte¬ 
za). Al utilizer medidas dc tiempo dc reaccidn 
para una scrie de dichos problemas novedosos 
o no consolidados, Sternberg (1981) encontrd 
quc las personas con mayor inteligencia pasan 
mas lienipo en la planificacidn global —for¬ 
mation dc una macroestrategia que se aplique 


a 6stc y otros problcmas similares— que nqu6- 
Uas con inteligencia menor. Asf, un aspecto im- 
portante de la inteligencia consiste cn conoccr 
cuando hay que dar marcha atrris y asignar el 
esfuerzo intelectual en lugar de atacar dc ma- 
nera obtusa un problema diffcil. 

Los componentes dc ejecucidn son los pro- 
ccsos rncntalcs bien cslablecidos que podrfan 
utilizarse para llevar a cabo una tarea o resolver 
un problema. Estos aspectos dc la inteligencia 
son los quc con toda probabilidad se miden 
mejor a iraves de las pruebas existenies de la 
misma. Ejemplos de los componentes de eje- 
cucidn incluycn memoria a corto plazo y razo- 
namiento silogfstico. 

Los componentes de adquisicldn del co- 
nocimiento son los procesos quc se ulilizan cn 
el aprendizaje. Sternberg ha enfatizado quc a 
fin de entendcr aqucllo quc hacc que algunas 
personas sean mis hibiles que otras, debe com- 
prenderse su capacidad cada vcz mayor para 
adquirir desdc un principio dichas habilidades. 
Un ejemplo es cl conocimiento de vocabulario 
que se aprende principalmentc en conlexto 
mis que a travds de instruction directa. Las per¬ 
sonas mis inteligentcs estin mejor capacitadas 
para utilizar los contextos circundantcs para 
dcscubrir lo quc significa una palabra; es decir, 
tienen mayorcs habilidades para la udquisicidn 
de conocimiento. Su mayor vocabulario sc 
debe, cn gran medida, a su mayor capacidad 
para "absorber” los significados dc las palabras 
que ven y escuchan cn su ambiente. Asf, el vo¬ 
cabulario es una excelente medida de la inteli¬ 
gencia porque refleja la capacidad dc las 
personas para adquirir information dentro dc 
un contcxto. 

El segundo aspecto dc la tcorfa dc Sternberg 
incluye In inteligencia basada cn la experien- 
cla. Segun la tcorfa, una persona con buena in¬ 
teligencia basada en la cxpcriencia puede 
enfrentarse de manera eficaz a tareas novedo¬ 
sas. Estc aspecto de su teorfa explica por qu6 
Sternberg es tan crftico con la mayor parte de 
las pruebas de inteligencia. En la gcneralidad 
de los casos, las pruebas existentes miden aquc¬ 
llo quc ya sc ha aprendido, al presentarle al in- 
dividuo tareas que ya conocc. Segun Sternberg, 
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la inteligencia tambidn implica la capacidad para 
aprender y pensar dentro dc nuevos sistemas 
conceptuales, no s6lo enfrentarse con tareas 
conocidas dc antcmano. Un segundo aspecto 
de este tipo de inteligencia es la capacidad para 
automatizar o “hacer rutinarias” las tareas que se 
cnfrentan de manera repeuda. Un ejemplo de la 
automatizacidn que se aplica a la mayorfa de 
las personas cs la lectura, la cual se lleva a cabo 
en gran medida sin influencia del pensamiento 
consciente, pero cualquier tarea o habilidad 
mental se puede automatizar si se practica lo 
suficiente. Tocar musica es un ejemplo de una 
habilidad de nivel cxtremadamentc elevadoquc 
puede automatizarse con la prictica suficiente. 

El tercer aspecto de la teorfa de Sternberg 
incluye la inteligencia contextual. £sta se de¬ 
fine como “la actividad mental que participa 
en la adaptacidn propositiva, el moldeamiento 
y la seleccidn de los ambientes reales iddneos 
para la propia vida" (Sternberg, 1986, p. 33). 
Este aspecto dc la teorfa parece reconocer que 
la conducta humana se ha moldeado a travds 
de prcsiones sclcctivas durante la historia evo- 
lutiva. La inteligencia contextual ticne (res par¬ 
tes: adaptacidn, selection y moldeamiento. 

La adaptacidn se rcfiere al desarrollo dc 
habilidades que se requiercn en el propio am- 
biente. La adaptacidn exitosa dificre de una 
cultura a otra. En la cultura de los pigmeos de 
Africa, la adaptacidn podrfa implicar la capaci¬ 
dad para rastrear clefantes y matarlos con fie- 
chas envenenadas. En las naciones induslriales 
dc occidente, la adaptacidn podrfa requerir la 
prcsentacidn favorable de uno mismo en una 
entrevista de trabajo. 

La seleccion podrfa llamarse localizacibn 
del nicho. Este aspecto de la inteligencia con¬ 
textual requiere de la capacidad para dcjar el 
ambiente en cl que uno se encuentra y selcc- 
cionar uno diferentc, mis adecuado para los 
talentos y necesidades. Feldman (1982) ha ilus- 
trado la manera en que la seleccidn puede ope- 
rar en la elecci6n dc carrcra de los niiios dotados 
intelectualmente, locual dctcrmina si alcanzan 
un dxito notable en la edad adulta. Esta in vesti- 
gadora hizo un scguimiento de los nifios que 
aparccieron en los programas de radio y televi- 


si6n Quiz Kids durante el decenio de 1950. Eg. 
tos nifios eran extremadamente inteligentes <k 
acuerdo con normas convencionales, la mayo, 
rfa con un Cl de 140 o mayor; algunos lograron 
ser muy exitosos al llcgar a la edad adulta. N 0 
obstante, la mayorfa Uevaron vidas bastante 
comunes y corrientes, desprovistas dc los lo- 
gros espectacularcs que podrfan haberse pro- 
nosticado con base en su precocidad. Aquellos 
que tuvieron mayor ixito habfan encontrado 
ocupaciones muy adecuadas a sus capacidadcs 
e intereses. En resumen, habfan seleccionado 
nichos ambientales que se adaptaban bien a su 
vida. Sternberg afirmarfa que la capacidad para 
seleccionar dichos ambientes es un aspecto 
importantc de la inteligencia. 

El moldeamiento es otro modo de mejo- 
rar la adaptacidn entre uno mismo y el ambien¬ 
te, en especial cuando la seleccidn de un nuevo 
ambiente no cs prictica. En esta aplicacidn de 
la inteligencia contextual, se moldea al ambiente 
de modo que se adapte mejor a las propias ne¬ 
cesidades. Un empleado que convence a su jefe 
de hacer las cosas de manera diferente, ha utili- 
zado el moldeamiento para hacer que su am- 
bientc laboral sea mils adecuado para sus propios 
talentos. 

Aunque la teorfa triirquica dc Sternberg es 
el modelo mis amplio y ambicioso que se haya 
propuesto a la fecha, no todos los investigado- 
res en psicometrfa lo han adoptado. Dctterman 
(1984) advierte que deberfan investigate los 
componcntes cognitivos bisicos de la intcligcn- 
cia antes de introducir constructos de orden 
superior que pueden ser innecesarios. Rogoff 
(1984) cuestiona si las tres subteorfas (compo- 
nencial, basada en la experiencia y contextual) 
estin suficientemente vinculadas. Pueden en- 
contrarse otros comentarios acerca de la teorfa 
triirquica en Behavioral and Brain Sciences 
(1984, pp. 287-304). 

Indcpendientemente del veredicto final 
acerca de la teorfa triirquica de la inteligencia, 
la insistencia de Sternberg dc que la inteligcn- 
cia tiene varios componentes que no miden las 
pruebas tradicionales parece correcta para cual- 
quiera que haya estudiado o aplicado dichas 
pruebas. Este autor cita el caso de un colega al 
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que sc le pidid que examinara a varios residen¬ 
ts de una institucidn para individuos con re- 
traS o mental. Los residents en cuestidn habfan 
planeado y ejecutado con dxito un escape de 
esta escucla, que era muy concienzuda en ma¬ 
teria de seguridad, lo cual reprcsentd una proe- 
ia que requiri6 altos niveles de inteligencia 
priclica. Sin embargo, cuando se les aplico el 


Test de Laberintos de Portcus (Porteus, 1965), 
una prucba cstandarizada que supuestamente 
midc la capacidad de planificacidn, estos indi¬ 
viduos no pudieron resolver de manera correc- 
ta ni siquiera el laberinto mis sencillo. Sternberg 
(1986) ha dejado claro que la inteligencia sim- 
plcmente tiene demasiados components como 
para medirla con cualquier pmeba individual. 


Bresumen 


1. A pesar de las conferences y anilisis eru- 
ditos, el conceplo de “inteligencia" ha es- 
quivado la definicidn consensual. No 
obstante, dos temas se repiten con cierta 
frecuencia en las definiciones de experts 
acerca de la inteligencia. Segun dstos, la 
inteligencia engloba 1) la capacidad para 
aprender de la experiencia y 2) la capaci¬ 
dad para adaptarse al propio ambientc. 

2. Los conceptos de legos y experts acerca 
de la inteligencia son muy semejantes. En or- 
den de importance, los legos consideran a la 
capacidad de solucidn de problemas practicos, 
la capacidad verbal y la compctcncia social 
como los ingredientes fundamentals; los 
experts piensan que la inteligencia verbal, 
la capacidad de solucidn de problemas y la 
inteligencia prdctica son importantes. 

3. Las primeras teorfas acerca de la inteli¬ 
gencia, propuestas a finales del siglo XX. 
enfatizaban la agudeza sensorial. Tanto Sir 
Francis Gallon como J. McKeen Cattcll 
consideraban que la inteligencia se susten- 
ta en capacidades sensoriales agudas. Am- 
bosdcsarrollaron varias medidas sensoriales 
en sus fallidos intents por medir la inteli¬ 
gencia. 

4. A inicios del siglo XX, Charles Spearman 
propusoque la inteligencia constaba de dos 
tipos de factores; un solo factor general, g, 
y numcrosos factores especfficos, s,, s 2 , 
Sj, y asf succsivamente. Spearman ayudd a 
inventar el an&lisis factorial como auxiliar 


para sus investigaciones acerca de la natu- 
raleza de la inteligencia. 

5. L. L. Thurstonc favorecid la perspectiva de 
que la inteligencia consta de aproximada- 
mente siete factores grupales en vez de un 
solo factor general, fists eran comprensidn 
verbal, fluidezde palabra, numero, espacio, 
memoria asociativa, velocidad perceptual y 
razonamiento inductivo. En ultima instan- 
cia, Thurstone reconocid la existencia de g 
como factor de primer orden. 

6. Raymond Cattcll propuso que la inteligen¬ 
cia estd formada por dos factores principa- 
les: inteligencia fluida (gp e inteligencia 
cristalizada (gp. La primera cs no verbal en 
su mayor parte y es una forma de eficicncia 
mental relativamente independiente de la 
cultura. La inteligencia cristalizada tiene 
una fuerte dependencia de la cultura y se 
emplea para (areas que requieren de una 
respuesta aprendida o habitual. 

7. Jean Piaget propuso una tesis del desarro- 
llo en su teona acerca de la inteligencia. 
Sugirid que los esquemas —patrones orga- 
nizados de conducta o estructuras mentales 
que conducen al conocimiento de edmo 
hacer las cosas— evolucionan hacia la ma- 
duracidn cada vez mayor a travds de un pro- 
ceso denominado equilibration. 

8. En la teorfa de Piaget, la asimilacidn es la 
aplicacidn de un esquema a un objeto, per¬ 
sona o acontecimiento. Si un esquema fun- 
ciona, surge un cstado de cquilibrio, de lo 
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contrario cl resultado es el desequllibrio—un 
estado dc tcnsidn dinamica. En estc ultimo 
caso, la persona debe adaptarel esquema para 
que funcionc —un proccso denominado 
acomodacion. 

9. J. P. Guilford propuso un modclo dc cs- 
tructura intclcctual (El) para resumir sus 
puntos de vista acerca dc la naturalcza mul- 
tifacetica dc la intcligcncia. Gasified lascn- 
pacidades intclcctualcs cn (res dimcnsioncs 
llamadas operacioncs (cinco (ipos), contc- 
nidos (cinco tipos) y productos (scis tipos). 
Dc esta mancra, Guilford propuso cn total 
150 tipos diferentes dc intcligcncia. 

10. Segun la tcorfa del proccsamicnto simulia- 
nco y sucesi vo, cl ccrcbro humano tienc dos 
formas especfficas de proccsamiento de 
informacidn: simultfinea, en la que se pro- 
cesan a un mismo tiempo grupos de informa- 
cidn principalmente espacial, y sucesiva, cn 
la que la informacidn se organiza dc manc¬ 
ra temporal cn una serie lineal. 

11. Algunos invesligadorcs han estudiado los 
fundamentos bioldgicos dc la intcligcncia. 


Porcjcmplo, varios estudios indican quefo 
inteligencia psicomctrica sc correlacionj 
con aspectos de los patrones dc ondas cu 
bralcs. En algunos de ellos, ia complejidad 
de la onda cerebral cvocada (cl poteneju 
evocado pro medio o PEP) se correlation 
a niveles de .70 a .80 con el Cl medido. \ 

12. H. Gardner propuso una tcorfa dc las in- 
tcligencias multiples basada de mancra 
aproximada cn cl cstudio dc las rdacioneJj 
cerebro-conducta. Afirma la existcncia de 
varias inteligencias relativamentc indepen- 
dientesque incluyen la intcligcncia lingUfs- 
tica, musical, Idgico-malcmatica, espacial, 
corporal-cinestdsica y personal. 

13. R. Sternberg propone una tcorfa (riarquica 
de la inteligencia con los siguientes aspec¬ 
ts: intcligcncia componcncial (los meca- 
nismos intemos responsables de la conducla 
intcligcnte); inteligencia basada en la expe¬ 
rience (la capacidad dc manejar de mancra 
eficaz las tareas novedosas) e intcligcncia 
contextual (adaptacidn, moldeamicnto y 
seleccidn de ambientes de la vida real). ' 
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Tenia 5B 

Evaluation de las capacidades 
de lactantes y preescolares 


Evaluacton de la capacidad del lactante 

Evaluacidn de la inteligencia del preescolar 

Utilidad practica de la evaluacidn con lactanles y preescolares 

Resumen 



El periodo de la lactancia y edad prees¬ 
colar se extiende aproximadamcnte dcsde el 
nacimiento hasta los seis anos de edad. Los cam- 
bios que ocurren durante este periodo son, ob- 
viamentc, profundos. El lactante desarrolla los 
reflejos bisicos. domina los hitos del desarrollo 
(asir, gatear, sentarse, ponerse de pie y demds), 
aprende un lenguaje y establece la capacidad 
para el pcnsamiento simbdlico. Para la mayorfa 
dc los nifios, el patrdn y progreso del desarro¬ 
llo se encuentra de manera visible dentro de If- 
mites normales. 

No obstante, en ocasiones los padres y pro- 
fesionales entrcnados en la evaluacidn de 


lactantes y preescolares se encuentran con nifios 
cuyo desarrollo parcce lento, demorado o, in- 
cluso, que muestran un retraso evidente. Estos 
nifios provocan una conmocidn de preguntas 
ansiosas: iQud tan retrasado est4? ^Cufiles son 
los prospectos de funcionamicnto normal en la 
escuela? ^Este nifio lograrii la independencia 
personal cuando lleguc a la edad adulta? 

En el extremo opuesto se encuentran aque- 
llos nifios precoccs que alcanzan los hitos del 
desarrollo meses o afios antes de lo progrania- 
do en tdrminos normativos. En estos casos, los 
orgullosos padres tienen un conjunto difcrentc 
de preocupacioncs: <,Quif tan avanzado est4 mi 
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hijo? ^Cuales son las dreas mas fuertes y mas 
ddbiles de funcionamicnto inteleclual? ^Este 
nino sera un adulto dotado? 

Los instrumcntos para la evaluacidn de 
lactantes y preescolares pueden ayudar a res¬ 
ponder las preguntas acerca de nidos en ambas 
situaciones. Por supuesto, estas prucbas tam- 
bidn proporcionan informacidn util acerca de 
la mayorfa de los ninos que caen en medio de la 
distribucidn. En este tema se revisa la naturale- 
za y aplicacidn de las principales mcdidas para 
lactantes y preescolares. Estas herramientas 
incluyen prucbas individuates, inventarios del 
dcsarrollo y escalas de clasificacidn. Se comien- 
za con una descripcidn de varios instrumentos 
dcstacados y despuds se investiga la pregunta 
fundamental del propdsito o utilidad. ^Cu.11 es 
el empleo de estas medidas? ^Cudl es el signifi- 
cado de una puntuacidn en un invcntario del 
desarrollo o en una prueba de inteligencia para 
preescolares? ^Hasta qud grado estos procedi- 
micntos permiten el prondstico de ias capaci- 
dades adultas o, en cse caso, ayudan a vaticinar 
el desempeno inicial en la escuela? Estas pre¬ 
guntas tendrdn mds significado si se revisan 
primero los instrumentos relacionacos. 

La revisidn se divide en dos partes: mcdi¬ 
das para lactantes (dirigidas a ninos desde el 
nacimicnto hasta los dos ados y medio de cdad) 
y prucbas para preescolares (dirigidas a ninos 
desde los 2 ados y medio hasta los 6 ados de 
edad). La divisidn es un tanto arbitraria, pero 
no por completo. Las pruebas para lactantes 
tienden a ser multidimensionales y a tener car- 
gas significativas en desatTollo sensorial y motor. 
A partir de los dos ados y medio de edad, es 
tfpico que se utilicen las medidas estandarizadas 
como la Escala de Inteligencia Stanford-Binet: 
Cuarta Edicidn, la Baterfa de Evaluacidn Kaufman 
para Nidos, las Differential Ability Scales (Es¬ 
calas de Capacidad Diferencial) y las Escalas 
McCarthy de Aptitudes y Psicomotrocidad para 
nidos para la evaluacidn de nidos preescolares. 
Estas pruebas tienen fuertes cargas en habili- 
dades cognitivas, como comprensidn verbal y 
pensamiento espacial. Asf, las escalas para lac¬ 
tantes y las prucbas para preescolares miden 
componentes un tanto diferentes de la capaci¬ 
dad intelectual. 


I evaluaci6n de la capacidad 

DEL LACTANTE 


INVENTARIOS GESELL DEL DESARROLLO 

Disedados para medir el progreso en cl dcsarro¬ 
llo de lactantes y nidos desde las cualro sema- 
nas hasta los 60 meses de edad, los Inventarios 
Gesell del Desarrollo sc publicaron por prime- 
ra vez en 1925, y despuds se han revisado de 
manera pcri6dica (Gesell. Ilg y Ames, 1974; 
Knobloch, Stevens y Malone, 1987). Cast todas 
las pruebas para lactantes han tornado presta- 
dos o han adaptado los reaclivos de los inven¬ 
tarios originates disedados por Arnold Gesell 
(1880-1961), de modo que es justo y apropia- 
do que se comience la presente revisidn con 
este instrumento. 

Los Inventarios Gesell del Desarrollo pro¬ 
porcionan un procedimiento estandarizado para 
la observacidn y valoracidn de los logros en el 
desarrollo que tienen los nidos en cinco dreas: 
motora gruesa, motora fina, desarrollo del 
lenguajc, conducta adaptativa y conductas per- 
sonales-socialcs. La mayor parte de los 144 
reactivos en el inventario son puramente obscr- 
vacionales y se basan en la inspcccidn directa 
de las rcspucstas de los nidos a juguetes y a 
situaciones estdndar. Por ejemplo, a conti nua- 
cidn se presentan algunos reactivos ilustrativot 
que por lo comun superaria un lactante de 40 
semanas de edad. 

Adaptativa 

Sedala a una bolita en un vaso. 

Tira de un cordel para obtener un anillo. 

Motora gruesa 

"Transita” por una barra utilizando dos 
manos. 

Se deja caer al piso con control. 

Motora fina 

Toma una bolita de manera decidida. 

Utiliza asimiento de “tijeras" en un cordel. 

Lenguajc 

Usa “da da” con significado. 

Responde a la palabra “no no”. 
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personal-social 

Extiende un juguete, pcro no lo suelta. 

Pasa los brazos por el vestido, si se le ayu- 
da a iniciar cl movimiento. 

g| range de edades del Inventario Gesell del 
Desarrollo es del nacimiento a los 60 meses. El 
genio de Gesell se encuentra en haber identifi- 
cado situaciones que ocurren de manera natu¬ 
ral en el hogar o la clfnica y en utilizar objetos 
o tareas con enorme atractivo para lactantcs y 
preescolares. En algunos casos, es neccsaria la 
informacidn de uno de los padres o de la perso¬ 
na encargada del cuidado del nino para califi- 
car los reactivos individuates. A pesar del 
ambiente naturalista de la prueba, los observa- 
dorcs, con el entrenamiento adecuado, pueden 
lograr confiabilidades interobservadores a la 
mitad del rango de .90 (Knobloch, Stevens y 
Malone. 1987). 

Los pediatras y otros especialistas en ra¬ 
tios son quienes emplean principalmentc los 
Invcntarios Gesell del Desarrollo para identifi- 
car a lactantes y nifios en riesgo de presentar 
alteracidn neuroldgica y retraso mental. Gesell 
nunca tuvo la intencidn de que su inventario 
fuera una prueba de inteligencia. Tenfa una fuer- 
tc orientneidn bioldgica en su investigacidn y 
suponfa que el desarrollo normal era una evo- 
lucidn madurativa que ocurrfa en una secuen- 
cia ttcil de predecir. Gesell determind que el 
desarrollo normal es un fendmeno con lfmites 
tcmporales: la variabilidad de edades para el 
logro de los hitos del desarrollo en la lactancia 
cs general mente pequena, en el rango de unas 
cuantas semanas para muchas tareas. Por tan- 
to, la demora grave para alcanzar a los hitos 
del desarrollo, establecidos por Gesell de ma¬ 
nera concienzudamenie cronoldgica, puede in¬ 
dicar alteracidn neuroldgica o retraso mental 
(Honzik, 1983; Lewis y Sullivan, 1985). Va- 
riosestudios indican que las Invcntarios Gesell 
del Desarrollo funcionan bien en la deteccidn 
de lactantes en riesgo (Knobloch, Stevens y 
Malone. 1987). 

Aunque los Inventarios Gesell del Desa- 
ftollo se emplean principalmente para la detec¬ 
cidn y diagndstico clfnicos, Knobloch, Stevens 


y Malone (1987) proporcionan una base mAs o 
menos definida para la obtencidn de Cocientes 
del Desarrollo para las cinco Areas y el desa¬ 
rrollo general. La fdrmula es la siguiente: 

__ Edad de maduracldn v 

CD * -X 100 

Edad cronoldgica 

La edad de maduracidn se basa en la “imagen 
clfnica total" de los hitos del desarrollo supera- 
dos y no superados en cada Area. Aunque no se 
proporcionan criterios precisos, la edad de 
maduracidn para un lactante parece ser la edad 
del desarrollo en la que se pasan la mayor par¬ 
te de los reactivos. Dado que sus propiedades 
tdcnicas no sc han estudiado dc manera ade- 
cuada, el Cociente del Desarrollo debe utilizarse 
principalmente como herramienta de investi¬ 
gacidn. 

Las pruebas Gesell son muy respetadas 
debido a que proporcionan descripciones deta- 
lladas de los hitos del desarrollo en la lactancia 
que no tienen paralelo en la bibliograffa sobre 
evaluacidn infantil (Nuttall, Romero y Kalesnik, 
1992), Sin embargo, el empleo de los inven¬ 
tarios Gesell como instrumento psicomdtrico ha 
recibido agudas crfticas en anos recientes. El 
problema bAsico parece residir en una falia de 
atcncidn a los criterios formales de confiabili- 
dad y validez. Por ejemplo, en los primeros 
manuales de Gesell los informes sobre la confia- 
bilidad test-retest son mfnimos o nulos. Cuando 
los investigadores contcmporAneos examinaron 
esta propiedad de las pruebas Gesell, los resul- 
tados fueron sorpiendentes. Lichtenstein (1990) 
informd de una correlacidn test-retest de s61o 
.73 con una muestra de 46 nihos, lo cual cae 
muy por debajo del nivel recomendado de .90 
para la toma de decisioncs sobre individuos 
(Nunnally, 1978; Salvia & Ysseldyke, 1991). 
Banerji (1992) concluyd que las pruebas Gesell 
funcionaban de manera deficiente como instru- 
mentos de deteccidn de la preparacidn para la es- 
cuela. En general, los especialistas en educacidn 
se muestran cautelosos en cuanto a la utiliza- 
cidn de estas pruebas para la toma dc decisio- 
nes sobre asignacidn o rctenci6n escolar. 
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ESCALAS ORDINALES DE DESARROLLO 
PSICOL6GICO 

Las Ordinal Scales of Psychological Develop¬ 
ment (Escalas Ordinales dc Desarrollo Psico- 
Idgico), llamadas dc aquf cn adelantc Escalas 
Ordinales, sc disefiaron como una herramienta 
basada en la tcorfa de Piaget para la medicidn 
del desarrollo intelectual entre nifios de 2 se- 
manas y 2 aflos de edad (Uzgiris y Hunt, 1989). 
Dichas heramientas incluyen seis escalas, cada 
una disefiada para medir una capacidad espeef- 
fica que surge durante el primer cstadio piage- 
tiano de la inteligencia sensoriomotora. Cada 
escala const.: de 5 a 15 pasos ordinales inde¬ 
pendences; es decir, los reacti vos se ordenaron 
en una secuencia del desarrollo que normalmcn- 
te no varfa. 

Las escalas son las siguientes: 

• Exploracidn visual y permanencia de objeto. 

• Desarrollo de medios-fines. 

• Imitacidn vocal y de ademanes. 

• Desarrollo de la causalidad operacional. 

• Construccidn de relaciones de objeto cn el 
espacio. 

• Desarrollo de esquemas para relacionarse con 
los objetos. 

Ante las muchas adversidadcs que surgen cuan- 
do sc examina a los lactantcs —cs posible que 
Horen, regurgiten, se alejen gateando, ignoren 
la tarea, se duerman o se queden fijados en la 
barba del examinador— las escalas de este ins- 
trumento poseen fuertes propiedades psicomd- 
tricas. En un estudio con 84 lactantcs, las 
Escalas Ordinales mostraron excclente confiabi- 
Iidad interobservadores (media de 96%). buena 
consistencia test-retest, ordinalidad respetable 
y correlaciones muy fuertes con la edad (Uzgiris. 
1976). En pocas palabras, este instrumento pa- 
rece ser un (ndice psicomdtricamentc sdlido de 
la inteligencia sensoriomotora. 

Uzgiris (1983) considers que el funciona- 
miento intelectual en la lactancia es cualitati- 
vamente diferente y “necesita comprcnderse por 
sus caracterfsticas propias”. Las Escalas Ordina¬ 
les se desarrollaron como un medio para inves- 
tigar la inteligencia del lactante dentro del 


esquema tedrico de Piaget; por esta raz6 n 
Uzgiris no prelcnde que su instrumento sirv 
como medio de prediccidn. En general, las co 
rrelacioncs entre las puntuacioncs de la escalj 
y cl Cl posterior son muy bajas hasta que | 0s 
lactantes tienen cuando mcnos 18 meses de 
edad. Muy pocos clfnicos utilizan el instrument 
para la detcccidn del desarrollo; sin embargo 
Dunst (1980) ha abogado por el empleo de es. 
tas escalas como base para cl disefio de un cu- 
rrfculo sdlido en tdrminos del desarrollo para 
nifios con discapacidad. Recicntemente, Auer 
y Reisberg (1996) han hecho surgir la fascinante 
posibilidad de que las Escalas Ordinales pue. 
dan emplearse para la evaluacidn cognitiva de 
la demencia grave en ancianos. 


ESCALAS BAYIEY DE DESARROLLO 
INFANT1L - II 

Despuds de dcccnios de preponderancia en el 
campo de la evaluacidn de lactantcs, las Esca¬ 
las Bayley de Desarrollo Infantil han tenido 
una revisidn reciente (Bayley, 1969, 1993). El 
formato de la escala es el mismo —la Escala 
Mental y la Escala Motora proporcionan pun¬ 
tuacioncs cuantitativas cstdndar normalizadas, 

con media dc 100 y dcsviacidn estdndardc 16_ 

pero las Bayley Scales of Infant Development- 
II cubrcn un rango mds amplio de edades, que 
va desde 1 hasta 42 meses. El tercer compo- 
nente, la Escala de Calificacidn Conductual, 
consta de 30 reactivos disefiados para evaluar 
atencidn, orientacidn, regulacidn cmocional y 
calidad motora. La Bayley—II ticnc nuevas nor- 
mas obtenidas con una mueslra aleatoria 
estratificada de 1 700 nifios que se asemeja 
mucho a los datos estadfsticos del censo de 
EUA para 1988 en cuanto a edad, sexo, origen 
dtnico, regidn y educacidn de los padres. 

La Escala Mental midc las siguientes ca- 
pacidades: 

• Agudcza sensorial/perceptual. 

• Adquisicidn de constancia objetal. 

• Memoria, aprendizaje y solucirtn de problcmas. 

• Vocalizacidn, comunicacidn verbal. 
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• Evidencia inicial de pensamiento abstracto. 

• Habituacidn. 

• Map e0 mental. 

• Lenguaje complejo. 

• pormaci6n de conceptos matemSticos. 

pscala Motora evalua las siguientes habili- 

dades: 

• Grado de control del cuerpo. 

• Coordinacidn de musculos grandes. 

• Control motor fino de manos y dedos. 

• Movimiento dindmico. 

• Praxis dindmica. 

• Imitacidn postural. 

• Estereognosis. 

La calidad tdcnica y la excelentc estandariza- 
ci6n de las escalas Bayley senalan a esta prue- 
ba como el pindculo psicomdtrico en su campo 
(Saltier, 1988). Aunque la escala Bayley-II tie- 
ne solo una modesta cantidad de investigacidn 
sobre validez, se asemeja en gran medida a su 
antecesora, para la cual se puede citar una enor- 
me cantidad de evidencias de validacidn. Asi, 
la validez de la Baylcy-II dcscansa, en parte, 
en su semejanza con la escala Bayley original. 
En cuanto a validez, el manual de la escala 
Bayley informa de una correlacidn de .57 entre 
la Escala Mental y el Cl de la Stanford-Binet 
para 120 nifios con edades de 24 a 30 meses. 
Self y Horowitz (1979) revisaron la volumino- 
sa literatura acerca de los correlatos de las pun- 
tuaciones de la escala Bayley. Esta escala 
muestra fuerte relacidn con la Stanford-Binet, 
con las Escalas Wcchsler, el desempefto en tarcas 
piagetianas, clase social y factores ambienta- 
les. Tambidn. las puntuaciones muy bajas en la 
escala Bayley predicen un resultado deficiente 
del desarrollo en la infancia tardfa (VanderVecr 
y Schweid, 1974). Rhodes, Bailey y Yow (1983) 
citan evidencia adicional sobre validez. 

Un estudio reciente sobre la validez de las 
Bayley Scales of Infant Development-11 (BSID-D) 
con lactantes prematures enconlrd una fuerte 
concordancia entre esta prueba y la primera, lo 
cual sustenta la validez clfnica de la revisidn 
(Goldstein, Fogle, Wieber y O’Shea, 1995). Un 
estudio con lactantes australianos sanos infor¬ 


ms que las puntuaciones de la BS1D-II eran 
apropiadamente mds bajas que las de la BSID, 
lo cual indica que las normas para la primera 
edicidn en verdad eran obsoletas (Tasbihsazan, 
Nettelbeck y Kirby, 1997). A pesar de estos 
estudios en apoyo a su validez, Nellis y Gridley 
(1994) sugieren precaucidn con la BSID-II hasta 
obtener mayor informacidn. 

Las escalas Bayley requieren mayor habili- 
dad y dempo (45 a 75 minutos) para aplicar e inter¬ 
pretar la prueba que instrumentos comparables 
como la Denver-2. En consecuencia, se reservan 
para evaluaciones especiales y para aplicacioncs 
de investigacidn; por lo comrin no se les udliza 
como instrumentos ruUnarios de deleccidn. 


RESUMEN: MEDIDAS ADIGONALES 
DE LA CAPAOOAD EN LA LACTANOA 

La evaluacidn de los lactantes es muy impor- 
tante y, sin embargo, muy diffcil. Por lo comiin, 
este grupo no sigue las instruccioncs y cs posi- 
blc que no pueda verbalizar lo que sabe. La 
evaluacidn de las capacidades de los lactantes 
representa un reto extraordinario. No obstante, 
docenas de autores de pruebas han respondido 
al llamado. Inclusive una revisidn breve de los 
instrumentos altemativos abarcarfa un capftulo 
completo. En el cuadro 5-4 se proporciona un 
breve resumen de los enfoques mds conocidos. 
En la mayor parte de estos instrumentos se 
emplea la observacidn o la prescntacidn de tareas 
sencillas al examinando. Para resefias adicio- 
nales sobre evaluacidn de lactantes, se motiva 
al lector a revisar los trabajos de Nuttall, Ro¬ 
mero y Kalcsnik (1992), Ricciuti (1994) y Sal¬ 
via e Ysseldyke (1991). 


I EVALUACldN DE LA INTEUGENOA 
DEL PREESCOLAR 


Los nifios preescolares exhiben gran variabili- 
dad en cuanto a madurez emocional y recepti- 
vidad hacia los adultos. Un nifto puede animar- 
se ante el examinador y luchar por dar su mejor 
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Cuadro 5-4. Medldas adicionales de la capacidad en la lactancia 


Inventsrlo del Desarrollo (Battelle Developmental Inventory, BDI; Newborg, Stock, Wnek, Guidubaldl v 
Svinicki, 1984). Del nacimiento a los ocho anos de edad; los 341 reactivos evaluan los dominios Personal- 
Social, Adaptatrvo; Motor; Comunicacibn; Cognitivo y Total. La baterla complete requiere de 1 a 2 horas para 
su aplicaclbn; una version del BDI para deteccibn (96 reactivos) ha reclbido graves crilicas. 

Developmental Assessment of Young Children (Evaluacibn del Desarrollo de Nlftos Pequehos DAYS 

Voress y Maddox, 1998). Del nacimiento a los seis anos de edad; la evaluacibn en cinco dominios (cognlclbn 
comunicacibn. socioemocional, fisico y adaptativo) se realiza a travbs de observacibn, entrevistas con los 
encargados del culdado del nifio y evaluacion directa. La DAYS proporciona una evaluacibn breve (20 minutos) 
con base en datos normativos sobresalientes (1 300 ninos divididos en 23 grupos por edad que se aproximan 
a los datos del censo de 1996). Los cinco indices resultanles y el Indice global son sumamente confiables (con 
coeficientes que van de .90 a .99). 

Developmental Indicators for the Assessment of Leamlng-3 (Indlcadores del Desarrollo para la 
Evaluacibn del Aprendtzaje-3 DIAL-3; Mardell-Czudnowski y Goldenborg, 1998). De los 3 a los 6 anos de edad; 
los dominios que se evaluan incluyen Motor (p. ej., atrapar, cortar, escribir), Conceptos (p. ej., nombrar, contar, 
clasificar) y Lenguaje (p. ej., sustanlivos/verbos, solucibn de problemas, extensibn de la oracibn). La conliabilkfad 
test-rotest en la parte afta del rango de .80 es extraordinary para un instrumento de este tipo. En el mismo estuche 
se tienen disponibles verslones en inglbs y espanol. 

Early Screening Inventory (Inventarlo de Detecclbn Temprana, ESI; Meisels, Wiske y Trvnan, 1984). Edades 
de 3 a 6 anos; es un Instrumento breve de deteccibn que proporciona punluaciones en cuatro areas —Dibujo de 
la Flgura Humana, Visomotora/Adaptativa; Lenguaje y Cognicibn y Motora Gruesa/Consciencia Corporal. La 
punluackSn total se utiliza para clasificar a los niftos en uno de tres grupos de canalizacibn: "Bien” (de superior 
al promedio a menos 1 DE); ‘reevaluar' (entre menos 1 y menos 2 DE) y "canalizar” (inferior a menos 2 DE). 

Early Screening Profiles (Perflles de Detecclbn Temprana, ESP; Harrison, Kaulman, Kaufman ycol., 1990), 
Edades de 2 a 6 afios; los dominios que se evaluan incluyen CognitivrYLenguaje, Motor y Autoayuda/Social; 
cuatro Exbmenes (Articulacibn, Conducts, Historial de salud y Hogar) complementan la evaluacibn. Este Instru¬ 
mento tiene fuertes cualidades psicombtricas; el manual proporciona Informadbn detallada en siete estudios 
de validacibn llevados a cabo de manera independiente con respecto al estudio de estandarizacibn. Barnett 
(1995) ofrece una revisibn escbptica; Telzrow (1995) se muestra mbs positivo. 

Gesell Child Development Age Scale (Escala Gesell de Edad del Desarrollo Infantil, GCDAS; Cassell, 
1990). De los 18 meses a los 10 anos de edad; esta prueba intenta poner en tbrminos operacionales la teorfa 
de etapas del desarrollo infantil de Gesell al pedirle a la madre, maestro o clinico que respondan a 100 reac¬ 
tivos de falso-verdadero, apropiados para cada edad, dentro de un conjunto mbs amplio de 240 reactivos. Se 
pueden utilizer hasta tres calif tea dores para valorar a un niflo; los resultados incluyen una grbfica de la edad 
cronolbgica contra la edad del desarrollo en 10 breas del desarrollo. La GCDAS es una prueba prometedora 
que requiere de mayor investigacibn en cuanto a cualidades psicombtricas (Lang, 1995). 


desempeiio en todas las preguntas. Otro puede 
mirar fijamente al piso y quedarse mudo mien- 
tras intenta realizar una sencilla tarea de disefto 
con cubos. En el primer caso se puede asegurar 
que los resultados de la prueba son un fndice 
apropiado del funcionamiento cognitivo; pero 


en el segundo, prevalece la incertidumbre. ^La 
falta de receptividad senala una carencia de 
habilidad o de cooperacibn? Con nifios prees- 
colares, el examinador requiere de una gran 
humildad. Scarr (1981) ha expresado este sen- 
timiento de la siguiente manera: 
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Cuarxio se mide ol luncionamionto cognitive de 
nifio. tambien se mide la cooperackin, alonetdn. 
persistence, capacidad para estarse quioto y ro- 
ceplividad social ante una situadon de evaluadtin. 

El peligro especial en la cvaluacidn preescolar 
e$ que el examinador puede inferir que una 
puntuacidn baja indica un bajo nivel de funcio- 
naniienio cognitive cuando, en realidad, el nirto 
un sdlo es incapaz de quedarsc quicto, atender, 
cooperar y asf sucesivamente. La evaluacidn 
preescolar requiere abordarse con un cuidado 
poco usual, a fin de evitar las consecuencias 
negalivas de la etiquetacidn y el diagndstico 
excesivo de padccimicntos discapacitantes. 

Existen varias pruebas de inteligencia de 
aplicacidn individual adecuadas para niiios pre- 
escolares. Schakel (1986) ha llamado a las si- 
guientes pruebas como “las cuatro grandcs”: 

• Escala Wechsler de Inteligencia para los Ni- 
veles Preescolar y Primaria (WPPSI-R) 

• Escala de Inteligencia Stanford-Binet: Cuar- 
ta Edicidn (SB:CE) 

• Batcria de Evaluacidn Kaufman para Niiios 
(K-ABC) 

• Escalas McCarthy de Aptitudes y Psicomotri- 
cidad para Niiios (MSCA) 

£stas son las pmebas de inteligencia mds co- 
munes en ninos preescolares. La ultima se acerca 
rdpidamentc a la obsolescencia (se publied en 
1972); a menos que se le revise, los psicdlogos 
cscolares pronto comenzardn a hablar de “las 
tres grandes”. Por supuesto, algunos de estos 
instrumentos van mds alld de la edad preescolar 
y llegan hasta los inicios de la ninez. La SB:CE 
sc utiliza tambidn con adultos. Se revisan dstas 
y otra prueba prometedora adicional: 

• las Differential Ability Scales. 

ESCALA WECHSLER OE INTELIGENCIA 
PARA LOS NIVELES PREESCOLAR 
Y PRIMARIA-REVISADA (WPPSI-R) 

El WPPSI-R es muy similar a su antecesor, pero 
ofrece una actualizacidn de normas y aplica- 
cidn para un rango mds amplio de edades —de 


los 3 a los 7 afios, 3 meses (Wechsler, 1989). 
Adcmds, se revisaron varios rcactivos obsoletos 
y parciales y se anadid una versidn de Compo- 
sicidn de objetos a las 11 subpruebas origina- 
les. La confiabilidad y validez del WPPSI-R son 
muy similares a las de la versidn anterior de 
esta prueba. Salvia e Ysseldyke (1991) resu- 
men las confiabilidades de divisidn en mitades 
como sigue: Cl Verbal (.86 a .96), Cl de Ejecucidn 
(.85 a .93) y Cl Total (.90 a .97). Las confiabili¬ 
dades de las subpruebas del WPPSI-R son 
sustancialmente mds ddbiles; sus intcrprctacio- 
ncs deben restringirsc a las puntuacioncs mix- 
tas de Cl. Las normas para el WPPSI-R se basan 
en una mueslra cuidadosamente estratifleada de 
1 700 ninos y en edad, sexo, regidn geogrdfica, 
origen dtnico y educacidn y ocupacidn de los 
padres; su validez se basa, en parte, en su pare- 
cido con el WPPSI, que obtuvo grandes ala- 
banzas de los revisores. Saltier (1988) revisd 
varias doccnas dc estudios en apoyo de la vali¬ 
dez concurrente y predictiva del WPPSI, y con- 
cluyd que la prueba sirve como un excelente 
medio de prediccidn a largo plazo de la inteli¬ 
gencia y del desempeho escolar en la adoles- 
cencia. 

La investigacidn inicial con el WPPSI-R 
confirma la validez predictiva de este instm- 
mento para el desempeno escolar posterior. Por 
ejemplo, Kaplan (19%) determind que los re- 
sultados preescolares del WPPSI-R predicen en 
gran medida las puntuacioncs de rendimiento 
escolar de los niiios desde el jardfn de infantes 
hasta el tercer grado. Los resultados con ninos 
en tercer grado se resumen en el cuadro 5-5 y 
revclan que los Cl Verbal y Total constituyeron 
medios de prediccidn mucho mds poderosos del 
rendimiento posterior que el Cl de Ejecucidn. 

Las subpruebas del WPPSI-R incluyen las 


siguientes: 

Verbal 

Ejecucidn 

Informacidn 

Composicidn dc objetos 

Comprensidn 

Disedos geomctricos 

Aritmdtica 

Diseno con cubos 

Vocabulario 

Laberintos 

Semejanzas 

Figuras incompletas 

Frases 

Casa de los animales 
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Cuadro 5-5. Correlaciones entre los 
Cl preescolares del WPPSI-R 
y resultados posteriores en una 
prueba de rendimiento para 72 nlfios 
de tercer grado 


Puntunciones del WPPSI-R 

Puntuaciones 
del programs 
completo de 
prueba-ltl 

CIV 

CIE 

err 

Capacidad verbal 

.62* 

.24 

.52* 

Comprenslfin auditiva 

.46* 

.02 

.30 

Comprensibn de leclura 

.48* 

-.03 

.28 

Mecfinica de la escrllura 

.54* 

.16 

.42 

Proceso de escritura 

.45* 

.08 

.32 

Capacidad cuantitatlva 

.44 

.17 

.36 

Matemfiticas 

.62* 

.34* 

.58* 


•p < .005. 

FiMnta: Reimpfeso con aulorizacMn de Kaplan, C. (1996) 
Predictive validity ol the WPPSI-R: a lour year followup study 
Psycitology In the Schools, 33.211 -219. 

Tres de estas 12 subpruebas (Frases, Disenos 
geombtricos y Casa de los animates) se encuen- 
tran s6lo en el WPPSI-R y se resumcn a conti- 
nuacibn (las otras nuevc subpruebas, comunes 
en todas las escalas Wechslcr, se analizan en el 
Tema 6A: Pruebas individuates de inteligencia). 
Frases es una subprueba complcmentaria en el 
WPPSI-R. £sta requiere que el nifio repita al 
pie de la letra una oracibn que le ha lefdo en 
voz alta el examinador. El reactivo m4s fficil sc 
cncuentra al nivel de “Juan tiene un coche ver- 
de”, mientras el mbs diffcil es mucho mbs lar¬ 
go y consta de dos oraciones conectadas como 
bstas: 

“Este vlernes visltaremos la huerta del granjero. 

Lleva una mooeda para que puedas comprar una 

calabaza." 

La subprueba de Disenos geomdtricos esti for- 
mada por 10 discfios —incluyendo un cfrculo, 
un cuadrado y un rombo— que el nifio debe 
copiar. Esta subprueba es una medida de las ca- 
pacidades perceptualcs y de organizacibn 
visomotora. Por ultimo, la subprueba de Casa 
de los animates requiere que el nino coloquc 


un cilindro de un color especffico (negro, bian¬ 
co, azul, amarillo) en un orificio debajo del 
animal apropiado (perro, polio, pez y gato, res- 
pecti vamente). Hay 25 animates distribuidos en 
secuencia aleatoria en una matriz de 5 x 5. La 
puntuacibn inicial en esta subprueba es la canti- 
dad de tiempo requerido para colocar un cilin¬ 
dro bajo cada animal. Los errores se restan de 
la puntuacibn total. El bxito en esta subprueba 
requiere capacidad de aprendizaje, destreza 
manual y atencidn sostenida durante los minu- 
tos que se necesitarfan para colocar un cilindro 
apropiado bajo cada uno de los 25 animales. 

La ampliacibn de la cobertura de edad ha- 
cia un Ifmite inferior de tres afios constituye una 
adicibn bien recibida para el WPPSI-R, dado 
que la identificacibn temprana de las dificulta- 
des del dcsarrollo es esencial para su tratamicn- 
to. Tambibn, las normas de Cl del WPPSI-R se 
extendieron hacia abajo hasta llegar a una pun¬ 
tuacibn de 41, que se cncuentra aproximada- 
mente a 3.9 desviaciones estfindar por debajo 
de la media de la poblacibn. En especial cuan- 
do se le utiliza junto con una evaluacibn de 
conducts de adaptacibn, el WPPSI-R es una 
herramienta esencial para el diagndstico del 
retraso mental de leve a grave en ninos prees¬ 
colares y en edad escolar temprana. Las nor¬ 
mas de Cl para esta prueba tambiln se extienden 
muy por arriba del rango necesario para la iden- 
tificacidn de inteligencia dotada en la mayor 
parte de los entomos escolares. Estos aspectos 
han hccho que el WPPSI-R sea muy popular 
entre los psicdlogos escolares y cspecialistas 
en desarrollo temprano. 


ESCALA DE INTELIGENCIA STANFORD- 
BINET: CUARTA EDI06n 

Con un rango de edades desde los dos afios 
hasta la edad adulta, la Escala de Inteligencia 
Stanford-Binet: Cuarta Edicidn (SB:CE) es una 
de esas pruebas poco comunes disefiadas pa¬ 
ra utilizarse por igual con preescolares, nifios y 
adultos (Thorndike, Hagen y Sattler, 1986). En 
el siguiente capftulo sobre pruebas individuales 
y grupalcs de inteligencia se presenta un anfilisis 
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(jetallado de las propiedades psicomrStricas de la 
sB :CE. Algunos comentarios en este capftulo 
(tsunuran su valor en la evaluacidn preescolar. 

La SB:CE consta de 15 subpruebas, pero 
no todas se aplican a cada uno de los grupos 
p 0 r edad. En el cuadro 5-6 se muestran las 
subpruebas en general y aquellas que por lo 
comun se aplican a ninos preescolares (hasta 
loscinco afios de edad). El lector observard que 
la SB:CE produce varias puntuaciones de 
subprueba. cuatro de tlrca y una mixta total, que 
ya no se denominn Cl. Por desgracia, en el caso 
de preescolares no se toma una muestra de la 
roisma profundidad de las cuatro dreas de con- 
tenido. El drea de Razonamiento verbal estd 
bien representada con ties subpruebas, pero la 
puntuacidn de Cuantificacidn se basa en una 
sola subprueba. Las otras das drcas (Razonamien- 
(oabstracto/visual y Memoria a corto plazo) se 
basan s61o en los resultados de dos subpruebas. 
Como se analiza en el siguiente capftulo. Saltier 
(1988)defiende unasolucidn dedos factoies para 
informar las puntuaciones de la SB:CE (Com- 
prensidn verbal y Razonamiento no verbal/Vi- 
$ualizaci6n) que con toda seguridad es el 
enfoque preferible en el caso de preescolares. 

Un aspccto esencial de la SB:CE es que la 
puntuacirtn mixta total es sumamente compa¬ 
rable con otros pilares de la evaluacidn prees¬ 
colar, como el WPPSI-R y el WISC-III. Por 
ejemplo, el manual del WPPSI-R informa de 
puntuaciones globales si mi lares para 115 nifias, 
de 4 a 7 afios de edad, examinados con ambos 
instiumentos: Cl promedio en cl WPPSI-R de 
105.3 contra puntuacidn mixta de 107.2 en la 
SB:CE (Wechsler, 1989). En un estudio con 30 
nifios preescolares, el Cl promedio en el 
WPPSI-R fue de 94.1, mientras la puntuacidn 
mixta de la SB:CE fue de 95.8 (McCrowell y 
Nagle, 1994). No obstante, los componcntes 
verbales de las dos pruebas difieren de manera 
signiftcativa: 95.5 para el CIV en el WPPSI-R 
)’ 101.6 para Razonamiento verbal en la SB:CE. 
Rust y Lindstrom (19%) encontraron punlua- 
ciones comparables entre la SB:CE y el WISC-III 
con 57 voluntarios (de 6 a 17 afios de edad), con 
puntuaciones totales que diferfan, en promedio, 
cn menos de dos puntos. Lavin (1996) (ambiln 


Cuadro 5-6. Subpruebas y areas 
de la Escala de Inteligencia 
Stanford-Binet, cuarta edicldn 

Razonamiento Verbal 
Vocabularlo* 

Comprensidn* 

Abaurdos* 

Relaciones Verbales 
Razonamiento Abstracto/VIsual 
Anfilisis de Patrones' 

Copiado- 

Matrices 

Doblado y cortado de papel 
Razonamiento Cuantltatlvo 
Cuantilicaci6n" 

Series de numeros 
Construcckin de ecuacionos 
Memoria a Corto Plazo 
Memoria de cuentas* 

Memoria de oraciones* 

Memoria do digitos 
Memoria deobjetos 

•Denota una subprueba que comOnmonle se emplea con nUtoa 
preescolares 

informd puntuaciones totales casi idlnticas en 
estos dos inslrumcntos para 40 ninos con eda- 
des de 6 a 16 afios. Sin embargo, en el examen 
de nifios con problcmas idcntificados del desa- 
rrollo, Lukens y Hurrell (1996) encontraron que 
las puntuaciones en el WISC-III eran menores 
en 29 de 31 casos, lo cual indica que la SB:CE 
puede subdiagnosticar el retraso mental. Se pue- 
de encontrar un antllisis amplio de la SB:CE 
en el contexto de la evaluacidn preescolar en 
Nuttall, Romero y Kalesnik (1992). Laurent, 
Swerdlik y Ryburn (1992) proporcionan una 
resefia de la investigaci6n sobre validez con la 
SB:CE. 

BATERfA DE EVALUA06n KAUFMAN 
PARA NINOS (K-ABQ 

La K-ABC es una medida combinada de inteligen¬ 
cia y rendimiento que se construyd de manera 
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aproximada dentro del esquema tcOrico de la 
neuropsicologfa modcma (Luria. 1966; Das. 
Kirby y Jarman, 1979). Muchas de las subpruc- 
bas de esta baterfa se parccen a pruebas neuro- 
psico!6gicas, las cuales se analizarOn con mayor 
detallc cn un tcma posterior, la K-ABC se orienta 
principalmcntc hacia la evaluacidn psicoedu- 
cativa y la planificacidn cducativa (Kaufman y 
Kaufman, 1983); sus defensores afirman que 
posee mayor relevancia para la planificacidn 
psicoeducativa que pruebas tradicionales como 
las escalas Wechsler y la Stanford-Binet. 

La K-ABC estd discfiada para nifios de 2 
anos y medio a 12 ados y medio de cdad y consta 
de 16 subpruebas, de las cuales no se aplican 
mis de 13 a cada nifio evaluado (figura 5-5). 
Diez de las subpruebas producen la PuntuaciOn 
Mixta de Procesamiento Mental, que estd 
normada para generar el promedio familiar de 
100 y desviacidn estindar de 15. Las otras seis 
componen la Escala de Rendimiento. Las 10 
subpruebas de procesamiento mental se des- 
componcn en dos escalas globales: Escala de 
procesamiento simultineo (siete subpruebas) y 
Escala de procesamiento secuencial (tres 
subpruebas). 

Un objetivo de la K-ABC consiste cn pro¬ 
duct puntuaciones que se traduzcan en inter- 
venciones educativas. Las escalas Secuencial 
y Simultinea sc basan aproximadamente en 
conceptos neuropsicoldgicos y se suponc que 
reflejan cl estilo de solucidn de problemas y de 
procesamiento de informaci6n del nifio. Las 
subpruebas de Procesamiento secuencial requie- 
rcn de la disposicidn en serie o temporal del con- 
tenido verbal, numdrico o visoperceptual. Se 
supone que los nifios con puntuaciones alias en 
esta escala —aprendices secuenciales— apren- 
dcn mcjor al enfrentar pcquenas cantidades de 
informacidn en orden consecutivo, paso por 
paso, como cn una serie de instrucciones ver- 
bales claras. En contraste, las subpruebas de 
Procesamiento simultineo requieren que el nifio 
sintetice y organice el contenido visoperceptual 
o espacial de manera inmediata o global. Se su¬ 
pone que los nifios con puntuaciones alias en 
esta escala —aprendices simultineos— aprcn- 
dcn mejor a travds de la integracidn y stntesis 


/ 


Escalade 

Procesamiento 

Secuencial 


Puntuacttn 
Mixta de 
Procesamiento 
Mental 

\ Escalade 

Procesamiento 

simuttHneo 


Escalade 

Rendimiento 


Movlmientos manuals 1 
Recuerdo de nOmeros 
Orden de palabras 

Ventana mftgtca 
Reconocimlento de 
roetros* 

Clerre gesMItlco 
TriAngulos* 

Analogies con matrtcei' 
Memoria espacial' 
jSories de lolograllas* 

Vocabulario oxpiestvo 
Rostros y lugares 
Aritmetica 
Acerlljos 

Lectura/decodlllcacliSn 

Lectura/comprensiOn 


'Escala no verbal 


Figura 5-6. Subpruebas y escalas de la Baterfa de Eva* 
luadbn Kaufman para nifios. 


de muchos trozos relacionados de informacidn 
al mismo tiempo, como se encuentra cn me- 
dios visuales (ilustraciones, mapas o griftcas). 

Kaufman. Kaufman y Goldsmith (1984) 
proporcionan pautas y ejemplos para la ense- 
fianza de la lectura, ortograffa y aritmetica a 
nifios con base cn las fortalezas secuenciales o 
si mu 1 (tineas en la K-ABC. Aunque la teorfa es 
convincente, la sustentacidn para la supuesta 
interaction entre aptitud y tratamiento de la 
K-ABC es dispar en el mejor de los casos. Por 
ejemplo, Fisher, Jenkins, Bancroft y Kraft (1988) 
cquipararon estrategias de ensefianza con los es* 
tilos cogniti vos secuencial/simultOneo (como se 
determinan a partir de la K-ABC) para 57 cstu* 
diantes de educacidn primaria inscritos en una 
clfnica de discapacidad para el aprendizaje. 
Aunque. en general, los resultados prestaron 
apoyo a la interaccidn predicha entre aptitud y 
tratamiento, los efectos fueron pocos y no tu* 
vieron ninguna importancia prdctica. 

Ambas escalas de la PuntuaciOn Mixta de 
Procesamiento Mental (PPM) se disefiaron para 
reducir los cfectos de la parcialidad de sexc y 
raza, y segun la mayor parte de los informes, 
los autores de la prueba tuvieron Oxito en estos 
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objctivos (Nolan, Watlington y Willson, 1989). 
Con base en los datos de cstandarizacitin, 
Kaufman. Kamphaus y Kaufman (1985) infor- 
juaron de diferencias pequenas (del orden de 
cinco puntos) entre la PPM de personas de raza 
blanca y de miembros de grupos minoritarios 
en la K-ABC. £sta es una diferencia mucho mds 
pequena que la que se encuentra por lo comun 
con pruebas como el WISC-III y la Stanford- 
Binet, dondc son comunes las diferencias del 
orden de 15 puntos de Cl a favor de las perso¬ 
nas de raza blanca. 

Valencia y Rankin (1988) sometieron a 
prueba a 76 nifios de raza blanca y 90 mdxico- 
estadounidenses de quinto y sexto grados e in- 
formaron que casi no habfa diferencia en la 
Puntuacidn Mixta de Procesamicnto Mental 
(100 contra 98, respectivamente), aunque se 
encontrd una gran diferencia en la Escala de 
Rendimiento (103 contra 91). Knight, Baker y 
Minder (1990) informan de una diferencia 
comparable entre la K-ABC y la SB:CE con 30 
niAos afroestadounidenses, cstudiantes de pri- 
maria, que presentaban discapacidad para el 
aprendizaje (PPM de 83 contra Puntuacidn 
Mixta de 84 en la SB:CE). 

En el cuadro 5-7 se dcscribcn las escalas y 
subpruebas de la K-ABC. Adem£s de las Esca¬ 
las SimultAnea, Secuencial y de Rendimiento, 
sc puede calcular una Escala No Verbal com¬ 
plementary con seis subpruebas (de los grupos 
simult^nco y secuencial) que no requierern de 
palabras. Las subpruebas de la Escala No Ver¬ 
bal incluyen las siguientes: 

Movimientos manuales. 

Rcconocimiento de rostros. 

Trifingulos. 

Analogfas con matrices. 

Memoriacspacial. 

Series de fotograffas. 

En el caso de las subpruebas No Verbales, el 
examinador demuestra cada tarea mediante 
ejemplos o mfmica. La Escala No Verbal es apro- 
piada para examinar a nifios bilingties o de inmi- 
gracidn reciente, cuyas habilidades en el idioma 
espanol podnan ser debiles. Adem£s, los nifios 
con deterioro auditivo, trastomos del habla o 


del lenguaje pueden evaluarse de manera im- 
parcial con csta escala. 

La K-ABC se estandarizd con una muestra 
nacional es’ratificada de 8 000 ninos seleccio- 
nados de modo cuidadoso para representar los 
datos del censo de EUA para 1980 en cuanto a 
sexo, regidn geogrdfica, educacion de los pa¬ 
dres, tamafio de la comunidad y categorfa Otnica 
(raza blanca, afroestadounidenses, hispanos, 
otros). Un rasgo poco comun y bienvenido de 
la muestra de estandarizacidn es el Infasis en 
ninos asignados a educacidn especial y a pro- 
gramas para inteligencia dotada y para nifios 
talentosos (aproximadamente 7% de la muestra 
normativa). Porotra parte, las normas sociocul- 
turales complcmcntarias para raza y educacion 
de los padres se obtuvieron de los resultados de 
prueba de 469 nifios afroestadounidenses y 119 
de raza blanca. 

La confiabilidad de la K-ABC es bastante 
buena en tlrminos generates, aunque algunas 
subpruebas poseen coeficientes de consisten¬ 
cy interna apenas aceptables, en especial con los 
individuos mSs jdvenes. En el caso de nifios 
preescolares, los valorcs medios van desde .72 
para Ventana mOgica hasta .88 para Recucrdo 
de numeros. En cuanto a los nifios en edad es- 
colar, los valorcs medios van de .71 para Cierre 
Gest&ltico a .85 para Analogfas con Matrices. 
Por otro lado, la confiabilidad de las puntua- 
ciones de Escala y de la puntuacidn mixta es 
muy fuerte. Por ejcmplo, la confiabilidad test- 
retest de la Escala de Rendimiento es de .93 
para nifios preescolares y de .97 para aqudllos 
en edad escolar. La Puntuacidn Mixta de Pro- 
cesamiento Mental tiene una confiabilidad de 
.90 con nifios preescolares y de .96 con aqu6- 
llos en edad escolar. 

Los cstudios sobre la validez de la K-ABC 
presentan una imagen heterogenea, con buen 
apoyo para la validez convergente de discrimi- 
nacidn, fuerte confirmacidn de la validez rela- 
cionada con el criterio y buena sustentacidn para 
los cambios apropiados a la edad en las puntua- 
ciones de prueba (pertinente para la valiJez de 
constructo). No obstante, los estudios analftico- 
factoriales sobre validez de constructo muestran 
resultados mixtos y conflictivos. Kamphaus, 
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Cuadro 5-7. Descripcidn de las subpruebas de la K-ABC 


Escala de Procesamiento Secuencial 

Movimientos manuales: el nifio debe copiar la sectiencia precise de golpes en la mesa con el pufto 
palma o lado de la mano ejecutados por el examinador. 

Recuerdo de numeros: muy similar a la prueba tradicional de retencibn de dfgltos, exceplo que al 
examinador se le Inslruye a no dejar caer su voz despots de decir el ultimo dfgito. 

Orden de palabras: mide la capacidad del nino para senalar a siluetas de objetos comunes en iguai 
orden que los mismos objetos nombrados por el examinador. 

Escala de Procesamiento Simultaneo 

Ventana magica: requiere que el nino identifique y nombre un objeto cuya ilustracibn se gira detrbs de 
una abertura estrecha, de modo que sblo se expone una fraccibn de la ilustracibn en algun momenta 
especilico. 

Reconocimiento de rostros: el nino debe prestar una estrecha atencidn a uno o dos rostros en una 
fotografia mostrada de manera breve y despuds seleccionar el rostro o rostros correctos en una fotograffa 
de grupo. 

Cierre gestdltico: el nino debe nombrar o describir de manera precisa una marrcha parcialmenle 
terminada, similar a una mancha de tinta. Esta subprueba mide la capacidad para llenar mentalmente 
los espacios vacios para lormar una gestalt. 

Tridngulos: el nifio debe ensamblar varios tridngulos idbntlcos de goma (amarillos en un lado, azules 
en el otro) para equipararlos con una Ilustracibn de un diseno abstracto. 

Analogias con matrices: con fichas de vinilo, el nino debe seleccionar la ilustracibn o diseno que 
mejor complete una matriz de 5 por 5 cm que express una analogia visual. 

Memoria espacial: el nifio debe recordar la localizacibn de ilustraciones ordenadas de manera aleatorla 
en una pdgina. 

Series de fotografias: el nino debe ordenar en una secuencia temporal adecuada una disposicibn de 
fotograffas dispuestas de manera aleatoria. Esta subprueba es similar a Ordenacibn de dibujos en las 
escalas Wechsler, excepto que la (area debe resolverse sin manlpulacibn fisica, lo cual elimina la 
tension innecesaria sobre la realimentacibn visomotora. 

Escala de Rendimlento 

Vocabulario expresivo: el nino debe nombrar el objeto representado en una fotografia. 

Rostros y lugares: el nifio debe nombrar a una persona muy conocida. personaje ficticio o lugar 
representado en una fotograffa. 

Aritmbtica: una prueba de habilidades bbsicas de cAlculo y de capacidades aritmbticas relacionadas 
con la escuela. 

Acertijos: el nifio debe inferir el nombre de un concepto concreto o abstracto con base en una lista de 
sus caracterfsticas. 

Lectura/Decodificacibn: una prueba de identificackin de letras y de reconocimlento/pronunclacidn de 
palabras. 

Lectura/Comprensidn: el nino debe demostrar comprensibn de lectura al seguir instrucciones dadas 
en oraciones. 
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Beres, Kaufman y Kaufman (1996) proporcio- 
n an una amplia revisidn de, literalmente, doce- 
n as de estudios de validez con la K-ABC. 

Lasescalas Simultiinea y Secuencial mues- 
tran el patrdn csperado de correlaciones con los 
factores simultdneo y sucesivo en olras bate- 
das de prueba (p. ej., Das y Mensink, 1989), lo 
cual indica buena validez convcrgente y de dis- 
criminacidn para estas escalas globales de la 
K-ABC. Cooley y Ayres (1985) encontraron 
correlaciones apropiadamente fuertes entre las 
puntuaciones de la K-ABC y medidas de ren- 
dimiento (validez convergente) y relaciones 
apropiadamente insignificantes entre las pun¬ 
tuaciones de la K-ABC y medidas de ansiedad 
cn la infancia (validez de discriminacidn). Tam- 
bidn se encontrd un descubrirruento un tanto 
singular: la Puntuaci6n Mixta de Procesamien- 
to Mental de la K-ABC se correlaciond en -.51 
con la escala de Hiperactividad de la Achenbach 
Child Behavior Checklist (Lista de Verificacidn 
Achenbach de Conducta Infantil) (la correla- 
ci6n es negativa porque una alta puntuacidn en 
Hiperacti vidad indica conducta disfuncional). 
Hsta lista de verificacidn bien validada consis- 
tc en reactivos que califican los padres (p. ej., 
el nifio no puede concentrarse, no puede prestar 
atencidn durante largo tiempo, no es agradable 
para otros nifios). En apariencia, la K-ABC 
detecta en cierto grado las capacidades de aten- 
cidn. Quiza la superposici6n es indirecta, donde 
ladeficiencia en capacidades de atenci6n condu¬ 
ce a la reduccidn en el logro de las habilidades 
intelectuales que sc miden con la K-ABC. 

La validez de esta prueba se sustenta tam- 
bien en los 43 estudios citados y resumidos en 
el Manual Interpretativo, incluyendo numero¬ 
us estudios de correlacidn con otras pruebas 
(Kaufman y Kaufman, 1983). Estas correlacio¬ 
nes varfan de manera amplia, pero en general 
dan apoyo a la validez de la K-ABC, al mcnos 
en cuanto a la punluacidn mixta de procesa- 
miento mental. En este sentido, las conclusio- 
nes de Obrzut, Obrzut y Shaw (1984) y de 
Naglieri (!985) son tfpicas. Con muestras in- 
dependientes de estudiantes con discapacidad 
para el aprendizajc y con retraso mental 
cducable, estos dos estudios informaron corre¬ 


laciones casi idcnticas de .80 y .83, respectiva- 
mente, entre el Cl del WISC-R y las puntuacio¬ 
nes mixtas de la K-ABC. 

Como recordarf el lector del capftulo so- 
bre validez, una manera de demostrar la validez 
de constructo de una prueba consiste en mos- 
trar que los cambios relacionados con la edad 
en las puntuaciones naturales son regulares, 
sensatos y consistentes con la teorfa. Reynolds, 
Willson y Chatman (1984) correlacionaron la 
edad y las puntuaciones naturales de la muestra 
de estandarizacidn (N = 2 000) y de una mues¬ 
tra adicional de personas afrocstadounidenses 
y dc raza blanca (N = 615). Todas las correla- 
ciones entre la edad y las puntuaciones naturales 
fueron sumamente significativas. Y mils impor- 
tante aiin, no ocurrieron diferencias significativas 
cn la magnitud de estas relaciones en funcidn 
de los grupos por raza o edad, lo cual sustenta 
la validez de constructo de la K-ABC como me- 
dida dc aptitud y rendimiento asociada con el 
desarrollo. 

Los estudios analftico-factoriales de las di- 
mensiones secuencial y simultiinea en las que se 
basa la K-ABC han producido resultados con- 
flictivos (Kamphaus, 1990). En el lado positi- 
vo, los autores de la prueba citan conclusiones 
tomadas de la muestra de estandarizaci6n que 
parcccn confirmar la distincidn entre secuencial 
y simultcinco (Kaufman y Kaufman, 1983; 
Kaufman, Kaufman, Kamphaus y Naglieri, 
1982). Algunos estudios independientes tambidn 
han informado de resultados similares (p. ej., 
McCallum, Karnes y Oehler-Stinnett, 1985). 

Los crfticos reconocen que la K-ABC es una 
buena medida dc la inteligencia general, pero 
se mucstran dudosos accrca dc la distincidn 
entre procesamiento simult^neo y secuencial 
como base para comprender el desempeno en 
la prueba. Por ejemplo, Strommen (1988) em- 
prendid un andlisis factorial confirmatorio de 
la K-ABC con el propdsito cspecffico de exami- 
nar la hipdtesis de que los factores que compo- 
nen a la prueba sdlo se correlacionan de manera 
moderada, lo cual constituye una de las afirma- 
ciones clave de los autores de la prueba (Kaufman 
y Kaufman, 1983). Este investigador concluyd 
que los factores que subyaccn a la K-ABC 
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estdn intercorrelacionados de mancra sustan- 
cial en todos los niveles por cdad. lo cual arroja 
dudas sobrc la existencia indcpendientc de los 
procesos sccucncial y simultdnco en la prucba. 
Estos constructos modernos bien pueden re- 
sultar vino viejo en pellejos nuevos, nada mds 
que una redenominacidn de la dicotomfa fami¬ 
liar entre formas sumamente intercorrelaciona- 
das de razonamiento verbal y no verbal. Para 
una intcrpretacidn mis positiva de los estudios 
analftico-factoriales de la K-ABC, vdase el ar- 
tfculo de reseiia de Kamphaus y colaboradores 
(1996). 

Una segunda cn'tica tiene que ver con la 
dcsignacidn de las seis subpruebas como prue- 
basdc rendimiento. Anastasi (1985) sefiala que 
una prueba puede considerarse apropiadamen- 
te como prueba de rendimiento s61o cuando se 
le vincula de manera estrecha con un conteni- 
do educativo especffico. No obstante, los auto- 
res de la K-ABC hicieron esfucrzos especialcs 
para separar las pruebas de rendimiento de cual- 
quier contenido curricular especffico. Estas 
subpruebas se parecen mils a las medidas tradi- 
cionales de inteligencia que a las de rendimiento 
acaddmico. jDe hecho, con base en las cargas 
factoriales en el primer factor sin rotacidn, 
muchos investigadores han concluido que las 
subpruebas de Rendimiento proporcionan una 
mejor medida de la inteligencia general que aqud- 
llas de proccsamiento mental! (Kline. Guilmcttc, 
Snyder y Castellanos. 1992). Esta controversy 
se basa, en parte, en posturas filosdficas diver- 
gentes en cuanto a la naturaleza de la inteligen¬ 
cia y no es probable que se resuelva a traves de 
la investigacidn (Reynolds, 1994b). 

Otra preocupacidn es que la K-ABC no 
detccta de manera suficiente las habilidades 
verbales (Sattler, 1988). A pesar de estas con- 
troversias, la K-ABC ofrece un enfoque unico 
e intcresante de la cvaluacidn de la inteli¬ 
gencia infantil y posce normas muy elevadas 
de calidad tdcnica. En tanto los examinadores 
incluyan las subpruebas de Rendimiento —que 
detectan la inteligencia general en grado sus- 
tancial— la K-ABC puede proporcionar un 
enfoque nuevo y valioso de la evaluacidn 
psicoeducativa. 


ESCALAS MCCARTHY DE APTITUDES 
Y PSICOMOTRICIDAD PARA NINOS 

Las Escalas McCarthy de Aptitudes y Psicorno. 
tricidad para Nifios constituyen una prueba de 
inteligencia de aplicacidn individual, diserlada 
para nifios entre los 2 aiios y medio y los 8 aflo, 
y medio de edad (McCarthy, 1972). La prueba 
consiste en 18 subpruebas indcpendientc] 
como se listan en el cuadro 5-8. Estas contn^ 
buyen a las puntuaciones en cinco escalas, cadj 
una se obliene de 3 a 7 subpruebas: Verba] 
Perceptual-Ejecucidn, Cuantitativa, Mcmoriay 
Motora. Adcmls, se puede calcular un fndice 
Cognitivo General con media de 100 y DEfc 
16 a partir de 15 subpruebas. La prueba se dist 
n6 para proporcionar un mejor entendimiento 
tanto de los nifios normales como de aquelloi 
que tienen discapacidad para el aprendizajt 
McCarthy (1972) enfatizd las consideracionej 
funcionales, como el deseo de identificar las 
debilidadcs cognitivas clinics y educati vamente 
relacionadas. como el principal critcrio paraU 
sclecci6n de rcacti vos y para los agrupamiemus 
de las subpruebas en las Escalas McCarthy. 

La muestra de estandarizacidn de I 032 
nifios consistid de aproximadamente 100 indi- 
viduos en cada grupo de edad, con incremen 
tos de medio afio desde los 2 afios y medio 
hasta los 5 afios y medio de edad e incrementos 
de un aiio desde los 5 aiios y medio hasta los 8 
aiios y medio. En cada nivel de edad, la mues¬ 
tra se estratified de manera aproximada en las 
siguientes variables, de acuerdo con el censo 
de Poblacidn de EUA para 1970: sexo, raza 
(blanca-no blanca), regidn geogrdfica, nivel 
ocupaciona! del padre y residency urbana-ru- 
ral. Se excluyd a los niiios con problemas men- 
tales o emocionales graves y sc incluyd a 
individuos bilingUes sdlo si podfan hablar y 
comprender el Inglds. Por supucsto, un proble- 
ma potencial con las escalas McCarthy es que 
los datos normativos, obtenidos a inicios del 
decenio de 1970, son bastantc obsoletos. 

Los datos de confiabilidad para las escalas 
McCarthy presentan una imagen heterogdnea 
El fndice Cognitivo General tiene un desempe- 
fio adecuado, con confiabilidades de division 
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Cuadro 5-8. Subpruebas y escalas de las Escalas McCarthy de Aptitudes 
y Psicomotricidad para Ninos 


Escalas 


Subpruebas 

Verbal 

Ejecucion 

perceptual 

Cuantitativa 

Memoria 

Motora 

fndice 

cogni¬ 

tive 

general 

Memoria pictbrica 

V 



Mem 


ICQ 

Conocimlenlo de palabras 

V 





ICG 

Memoria verbal 

V 



Mem 


ICG 

fluldez verbal 

V 





ICG 

Analog/as opoestas 

V 





ICG 

Coeslrucxion con cubos 


P 




ICG 

SolucirSn de rompecabezas 


P 




ICG 

Secuencia rftmica 


P 


Mem 


ICG 

Orientacidn derecha- 


P 




ICG 

izqulerda 







[>bujo de un diseno 


P 



Mot 

ICG 

Dibujo de un nifto 


P 



Mot 

ICG 

Agrupamlento conceptual 


P 




ICG 

Preguntas con numeros 



C 



ICG 

Memoria numbrica 



C 

Mem 


ICG 

Conteo y clasificacidn 



C 



ICG 

Coordinacidn de piemas 





Mot 


Coordlnacidn de brazos 





Mot 


Accl6n imltativa 





Mot 



en mitades quc promedian cerca de .93 y co- 
efkientes test-retest a un mes que tiencn un pro- 
medio aproximado de .90. Las confiabilidades 
dedivisidn en mitades para las cinco escalas van 
de .79 a .88, mientras los coeficientes test-retest 
vin de .69 a .89. Las confiabilidades para las 
I8subpruebas individuates son sustancialmente 
nwnores, de modo que se advierte a los exami- 
nadorcs que no coloquen demasiado dnfasis en 
los patrones y diferencias de subprueba. 

Por desgracia, no se ha confirmado la de- 
nvacidn con base clfnica de las cinco escalas 
McCarthy a iraves de estudios anali'tico-facto- 
ni >les. lo cual deja en duda la validez de este 


instrumento. Aunque los cinco factores (quc 
corresponden a las cinco escalas) se encontra- 
ron en todos los grupos por edad dentro de la 
muestra de cstandarizacidn (Kaufman, 1975), 
estudios postcriores no han reproducido estas 
conclusiones originales. Por cjemplo, Forns- 
Santacana y G6mez-Benito (1990) cncontraron 
cinco factores en una muestra de 141 nifios de 
4 y 5 aflos de edad, pero £stos no corresponden 
a la clasificacidn propucsta por McCarthy. Otros 
investigadores informan de casos similares en 
los quc no se pudo corroborar la distribuci6n 
original de las subpruebas. Por cjemplo, Keith 
y Bolen (1980) encontraron s6lo tres factores 
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en una muestra de 300 niiios con edades de 6 a 
8 arios y medio de cdad: cognitivo general, ver¬ 
bal y motor. 

La confusidn acerca de la estructura fac¬ 
torial de las escalas McCarthy indica quc los 
examinadores debcn ser precavidos en el anri- 
lisis de un perfll que se base en las cinco escalas 
antes mencionadas (Vcioal, Perceplual-Ejecu- 
ci6n, Cuantitativa, Memoria y Motora). En 
muchas muestras y para algunos grupos por 
edad, las escalas pueden ser mejores como me- 
didas de la capacidad cognitiva general que de 
las capacidades especfficas designadas por los 
nombres de las escalas (Saltier, 1988). 

En el lado positivo, las escalas McCarthy 
funcionan muy bien como medios de prediccidn 
de la preparacidn para la escuela y del rendi- 
miento escolar posterior en el caso de ninos en el 
jardfn de infantes. Massoth y Levenson (1982) 
sometieron a prueba a 33 ninos con la escala 
McCarthy en el pcriodo de otoho del jardfn de 
infantes y correlacionaron estas puntuaciones 
con los resultados de la prueba de prepara- 
cidn para la lectura aplicada un afio despuds y 
tambidn con los niveles de rendimiento a la ter- 
minacidn del primer grado de primaria. Curio- 
samente, las correlaciones mis fuertes se 
obtuvieron con la Escala Cuantitativa, mientras 
la Escala Verbal tuvo un resultado deficiente 
como medio de prediccidn de la preparacidn 
para la escuela o del rendimiento en lectura 
(cuadro 5-9). Las capacidades perceptuales y 
analfticas quc miden las escalas McCarthy pa- 
recen ser mejores medios de prediccidn de la 
preparacidn y del rendimiento en lectura que 
las tareas verbales. Un seguimiento a los seis 
afios con los mismos individuos reveld correla¬ 
ciones sorprendentemente alias enlre las esca¬ 
las McCarthy aplicadas en el jardfn de infantes 
y el rendimiento escolar en el sexto grado 
(Massoth, 1985). La Escala Cuantitativa mos- 
tr6 la correlacidn mis fuerte con las califica- 
cion«--s del curso (r=.60), mientras que la Escala 
Verbal constituyd un medio de prediccidn d6- 
bil (r = .40). La Escala Cuantitativa parecerfa 
ser una cxcclcntc prueba de deteccidn para ni- 
fios preescolares. 

En resumcn, las escalas McCarthy propor- 
cionan un fndice valioso y adccuado para la 
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Cuadro 5-9. Correlaciones entre las 
puntuaciones de la Escala McCarthy 
y la preparacldn, y el rendimiento 
en lectura de 33 nifios en el jardfn 
de infantes 


Escala 

McCarthy 

Preparacidn 
para (a 
Lectura de 
Macmillan 

Prueba 
Metropo. 
litan da 
Rendi¬ 
miento 

Verbal 

.33 

.16 " 

Ejecucidn- 

Perceptual 

.39* 

.37* 

Cuantitativa 

.64’* 

.50” 

General Cognitiva 

.53” 

.39* 

Memoria 

.39* 

.28 

Motora 

.31 

.35* 


*p < .05 
“p< 01 

Fuenlo: Adaptado con autodzaadn de Massoth, N A y Levenson. 
R. L. (1982) The McCarthy Scales ot Children's Abllltlei as a 
prediclor ol reading readiness and reading achievement 
Psychology In the Schools, 19,239-296. 

prediction del funcionamiento intelectual, en 
especial con niflos cn el rango de 5 a 6 anos de 
cdad. El instrumento tambidn cs una excelentc 
herramienta para la evaluacidn de la intcligcncia 
general, aunque puede subestimar el funciona¬ 
miento de preescolares, niiios con discapacidad 
para el aprendizaje y con retraso mental. En la 
actualidad, las normas para la prueba son su- 
mamente obsolctas. A pesar de esto, las pun- 
tuaciones generales en la escala McCarthy co- 
rrcsponden de manera estrecha a los Cl Totales 
del WPPSI-R (Karr, Carvajal, Elser y Bays, 
1993). Aun asf, las escalas McCarthy necesi- 
tan revisidn y reestandarizacidn. 

ESCALAS DE CARACJDAD DIFERENCIAL 

Las Differential Ability Scales (DAS) son una 
adicidn recientc a la evaluacidn individual de 
la inteligencia que es digna de un breve comen- 
tario (Elliott, 1990, 1997). La DAS cubre un 
rango de edades de los 2 ados y medio a los 18 
anos cn tres baterfas superpuestas: prccscolar 
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inferior (edades de 2:6 a 3:5), preescolar superior 
(edadcs de 3:6 a 5:11) y edad escolar (edades 
je 6:0 a 17:11). Aquf se presenta la baterfa pre¬ 
escolar superior. 

Las subpruebas de la batcria preescolar in- 
cluyeo subpruebas "esenciales” y “diagnbsti- 
cas"- Las primeras cstan altamentc saturadas del 
factor g y sc utilizan para obtener dos puntua- 
ciones de brea (Verbal y No Verbal) y una pun- 
tuacidn mixta global conocida como Capacidad 
Conceptual General (CCG). Las puntuaciones 
de ilrea y la CCG se basan en una media de 100 
y desviacidn cstbndar de 15. Las subpruebas 
diagndsticas midcn memoria a corto plazo y 


velocidad de procesamiento de informacibn. 
Se les utiliza solo para el anblisis clfnico. Las 
subpruebas diagnbsticas dependcn menos del 
factor g y, por tanto, no figuran en la puntua- 
cidn mixta global. Las subpruebas de la DAS 
se describen en el cuadro 5-10. 

La confiabilidad de las puntuaciones de la 
DAS es encomiable para un instrumento quc 
se utiliza en el nivel preescolar. En el caso de 
preescolares, se informa que la confiabilidad 
de la CCG es de .90 a .94. Para preescolares 
mayores (3 anos y medio a 6 afios de edad) 
las puntuaciones agrupadas Verbales y No 
Verbalcs muestran confiabilidades de .88 y .89, 


Cuadro 5-10. Subpruebas de la Baterfa Preescolar DAS 


Subprueba 

Capacidades Medldas 

Contribucion a la 
puntuaclbn mixta 

Subpruebas esenciales 



Comprensibn verbal 

Lenguaje receptivo, comprensibn de Inslru- 
cciones verbales 

Verbal, CCG 

Vocabulario de nombres 

Lenguaje expresivo, conocimiento de nom¬ 
bres 

Verbal. CCG 

Semejanzas con dibujos 

Razonamiento no verbal, equiparacibn de 
llustraciones con temas comunes 

No verbal, CCG 

Construccibn de patrones 

Visuallzacibn no verbal, espacial, con cubos 
y cuadrados de colores 

No verbal, CCG 

Copiado 

Copiado de disenos, coordinacibn motors fi¬ 
ne; equiparacibn visoespacial 

No verbal, CCG 

Primeros conceptos de numero 

Subpruebas diagnbsticas 

Conocimiento de conceptos de numero y 
cuantitativos 

CCG 

Conslruccion con cubos 

Orientacibn espacial, equiparacibn visoper- 
ceptual con cubos 

n/a 

Equiparacibn de formas pareci- 
das a letras 

Relaciones espaciales, discrimlnacibn visual 
de formas similares 

rVa 

Rscuerdo de digitos 

Memoria auditiva a corto plazo de secuen- 
cias numbness 

n/a 

Racuerdo de objetos 

Aprendizaje a corto plazo y recuerdo verbal 
de ilustraclones 

n/a 

^conocimiento de dibujos 

Memoria visual a corto plazo, reconocimien- 
to de objetos famlliares 

n/a 


nto* noaplica 
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Cuadro 5-11. Correlaclones entre las puntuaclones mixtas de la DAS 
y el WISC-III de 53 nifios con discapacidad para el aprendizaje 


Puntuacibn mixta del WISC-III DAS 


Puntuacibn mixta de la DAS 

CIV 

CIE 

err 

Media 

DE 

Verbal 

.77 

.52 

.72 

90.2 

12.0 

Razonamiento no verbal 

.55 

.65 

.67 

83.5 

12.5 

Espacial 

.50 

.67 

.64 

93.6 

17.0 

CCG 

.68 

.71 

.78 

87.2 

14.8 

Media del WISC-III 

89.4 

93.2 

89.7 



DE del WISC-III 

13.8 

14.2 

13.2 




Fuante: Reimpreso con autorizackJn de Dumont, R.. Cruse, C., Price. L y Wholley. P. ( 1 996). The relationship between the Dllterertl«| 
Ability Scales (DAS) and the Wechsler Intelligence Scale lor Chiktren-Thlrd Edition (WISC-III) lor students with learning disabiMj.. 
Psychology In the Schools. 33. 203-209 


respectivamente. Los estudios sobre validez 
concurrente prestan un fucrtc apoyo a la 
DAS. con coirelaciones cn los rangos de .70 y 
.80 con otras medidas preescolares dc la inteli- 
gencia y rcndimiento (Elliott, 1990ab). Un es- 
tudiode Dumont, Cruse, Price y Whelley (1996) 
provee una muy fuerte sustcntacibn para la va- 
lidcz de la DAS al proporcionar un patrdn con- 
firmatorio dc las correlaciones entre este 
instrumento y el WISC-III con 53 nifios en los 
que se habfa idenlificado discapacidad para 
el aprendizaje. Los resultados se resumcn cn el 
cuadro 5-11 y muestran que los componcntcs 
similares se correlacionan cn mayor medida que 
aquellos diferentes en las dos pruebas. Tam- 
bitSn. dicho cuadro revela que las puntuaciones 
totalcs son muy similares, en promedio, entre 
la DAS (CCG media dc 87.2) y el WISC-III 
(Cl medio de 89.7). Elliott (1997) describe es¬ 
tudios adicionales de validez para este magnffi- 
co instrumento. 


I imUDAD PRACTICA 
DE LA EVALUACldN DE 
LACTANTES Y PREESCOLARES 


En general, la historia de la evaluacibn infantil 
ha mostrado una y olra vez que las puntuacio¬ 
nes de prueba que se obtienen en los primeros 
uno o dos anos de vida muestran una validez 


predictiva minima. Por ejemplo, en su resena 
acerca de las pruebas de inteligcncia con 
lactantes, Goodman (1990) concluyb: 

Si el pronbstlco exitoso de la intellgeocia de 
adotescentes y adultos a partir de las pun¬ 
tuaciones en la infancia temprana es uno de los 
principaies logros de la pstcologfa aplicada, on- 
tonces la incapacidad para predeclr la inteligen- 
da de la primera infancia a partir de la lactancia 
puede considerate como uno de sus mayores 
fracasos. 

Dado cl pbsimo histonal de fracasos repetidos 
en cuanto a validez predictiva, deberfa hacerse 
una diffcil pregunta: ^Cubl es el propbsito y 
utilidad prbctica de la evaluacibn de lactantes? 
De hecho, las pruebas con dstos ticncn una fun- 
cibn importantc, pero limitada, que represen- 
tar. Se regresarb a esta cuestibn despuds de 
revisar los estudios predict! vos. 

VAUDEZ PREDICTIVA DE LAS PRUEBAS 
CON LACTANTES Y PREESCOLARES 

Cuando se trata dc muestras heterogeneas dc 
nifios normales, el resultado general es que las 
puntuaciones de pruebas con lactantes se 
correlacionan en sentido posilivo, pero de modo 
poco impresionantc, con las puntuaciones de 
prueba en la infancia (Goodman, 1990; McCall. 
1979). Unos cuantos estudios muestran un tono 
mbs optimista (p. ej., Wilson. 1983), pero la 
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mayorfa de los investigadores concuerda con 
la conclusidn de McCall (1976): 

En tdmninos generates, esencialmente no exists 
correlacion enlre el desempeAo durante los pri- 
meros seis meses de vida y la puntuacidn de Cl 
despuSs de los cinco anos de edad; las correla- 
dones so colocan de manera predomlnante en 
el nivel de 0.20 para las evaluaciones realizadas 
enlre los 7 y 18 meses de vida cuando se trata 
de predeclr el Cl en el perlodo de 5 a 18 aftos de 
edad. y no es slno hasta los 19 a 30 meses que 
la prueba con lactanles pronostica el Cl poste¬ 
rior en el rango de 0.40 a 0.55. 

McCall (1979) volvid a confirmar su conclu¬ 
sion original en una resena posterior que se ha 
resuniido aquf. El lector observarS en el cuadro 
5-12 que las corTelaciones cntrc las puntuacio- 
nes de pruebas con lactantes y con nifios en edad 
escolar no superan al .40 hasta que los indivi- 
duos tienen, cuando menos, 19 meses de edad 
en la prueba inicial. 

Las conclusiones con pruebas para prees- 
colarcs tienen un cardcter un tanto mds positi¬ 
ve. La correlacidn entre los resultados de 
pruebas preescolares y cl Cl posterior es. por 
lo comun, fuerte, significativa y representati- 
va. La manera mis sencilla de investigar esta 
cuestidn consiste en medir la estabilidad de los 
resultados de Cl en estudios longiludinales. En 


Cuadro 5-12. Resumen de correlaciones 
entre puntuaclones de prueba de 
Inteligencia para lactantes y ninos 
en individuos normales 


Edad de la prueba 
inicial en la 
lactancia (meses) 

Edad de prueba en la 
Infancia (aftos) 

3-4 

5-7 

8-18 

1-6 

.21 

.09 

.06 

7-12 

.32 

.20 

.25 

13-18 

.50 

.34 

.32 

19-30 

.59 

.39 

.49 


Fuonte: Adaptado con aulorizaciOn de McCall. R 8. (1979). The 
development ol intellectual functioning in inlancy and the predkAon 
Ol later IQ. En J. D. Osofsky (Ed ), Handbook ol Infant 
development, Nueva Ybrk: John Wiley 

el cuadro 5-13 se resume la estabilidad de las 
puntuaciones de Cl de ninos en la Stanford- 
Binet de una edad a otra. Estos datos provic- 
nen del Estudio Longitudinal Fels, una de las 
primeras investigaciones de seguimiento del 
desarrollo intelectual y emocional de nifios 
(Sontag, Baker y Nelson, 1958) que se consi- 
dera chisica. La correlacidn m£s baja en este 
cuadro es .43 y se cncuentra entre el Cl evalua- 
do a los cuatro anos y de nuevo a los 12 afios 


Cuadro 5-13. Estabilidad del Cl de los 3 a los 12 ados de edad 


Edad de la prueba inicial 



Edad de la repeticidn de la prueba 



4 

5 

6 

7 

8 

9 

10 

11 

12 

3 

.83 

.72 

.73 

.64 

.60 

.63 

.54 

.51 

.46 

4 


.80 

.85 

.70 

.63 

.66 

.55 

.50 

.43 

5 



.87 

.83 

.79 

.80 

.70 

.63 

.62 

6 




.83 

.79 

.81 

.72 

.67 

.67 

7 





.91 

.83 

.82 

.76 

.73 

8 






.92 

.90 

.84 

.83 

9 







.90 

.82 

.81 

10 








.90 

.88 

11 









.90 


Fusnto: Adaptado con autorizaettn de Sontag, L.W., Baker. C. y Nelson, V. (1958). Mental growth and personality development: A 
longitudinal study. Monographs ol the Society for Research in Child Development, 23, (No. 68 complete) Copyright O de The Society lor 
Research in Child Development, Inc. 
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de edad. Lo que se destaca del cuadro es ta 
fortaleza del vfnculo entrc cl Cl cn la edad pre- 
cscolar y cn la infancia posterior. Entrc mayor 
sea el nifio cuando se le somete a prueba por 
primera vez, mis fucrte scri la rclacidn con el 
Cl posterior. De hccho, los resultados sugiercn 
que. en promedio, el Cl se vuelve razonable- 
mente estable hacia los ocho ados de edad. 

Dc mancra colectiva. estas conclusiones 
confirman que, en general, las pruebas con 
lactantes tiencn un valor prondstico deficiente, 
mientras que aquellas con preescolares tiencn 
un desempefto moderado en la prediccidn de la 
inteligencia posterior. Esto conduce a la pre- 
gunta planteada al iniciode esta section: ^Cuil 
es el propdsito y utilidad prictica de la evalua- 
cidn dc lactantes? 

UTIUDAD PRACT1CA DE LAS ESCALAS 
BAYLEY-II Y DE OTRAS ESCALAS 
PARA LACTANTES 

El empleo mis importantc y justificable de las 
pruebas con lactantes es la deteccidn de 
discapacidadcs del desarrollo. Aunque las prue¬ 
bas existences para la ctapa de la lactancia son 
deficientcs como medios de prediccidn dc la 
inteligencia en la infancia, una excepcidn a esta 
regia se encuentra en el caso de lactantes que 
obtienen una puntuacidn muy baja en pruebas 
como la Bayley-II y otros instrumentos de detec - 
cidn. Porcjemplo, los lactantes que tienen pun- 
tuacioncs a dos desviacioncs ftstindar por de- 
bajo de la media en la escala Bayley, cn particular 
en la Escala Mental, tienen una elevada probabi- 
lidad de obtener despuds en su vida resultados de 
prueba en los rangos de retraso mental (Self y 
Horowitz, 1979; Goodman, Malizia, Durieux- 
Smith, MacMurray y Bernard, 1990). 

Con nifios en situacidn de riesgo, la corre- 
lacibn entre las puntuacioncs de prueba cn la 
lactancia y el Cl posterior cn la nifiez es mucho 
mis fuerte que para las muestras de nifios nor- 
males. McCall (1983) determind que la corre- 
lacidn mediana entre las puntuaciones de prueba 
en la lactancia y cl Cl en la infancia en un se- 
guirniento a siete ados era un robusto .48. La 


conclusidn mis consistente es que una puntua- 
cidn muy baja en una prueba para lactantes 
—dos desviaciones estindar por debajo dc la 
media o mis baja— predice de mancra precisa 
un Cl bajo cn la infancia (Frankenburg, 1985). 
Por ejemplo, los estudios con la Denver Develop¬ 
mental Screening Test-Revised (Prueba Denver 
de Deteccidn del Desarrollo-Revisada; desde 
entonces publicada como Denver-II) reveld una 
tasa falsa positiva de sdlo 5 a 11%, lo cual 
significa que los lactantes y preescolares iden- 
tificados como nifios en riesgo pocas veces lo- 
graban un funcionamicnto en el rango normal, 
Los estudios con las escalas Bayley tambidn se 
conforman a este patrdn (p. ej., VanderVeer y 
Schweid, 1974). 

NUEVOS ENFOQUES DE LA EVALUAC16n 
CON LACTANTES 

Lewis ha afirmado que las pruebas tradiciona- 
lcs para lactantes pasan por alto las conductas 
iniciales de procesamiento de informacidn, 
como la memoria de reconocimicnto y la aten- 
cidn hacia el ambientc, que podrfan predeeir 
mejor la funcidn cogniti va en la infancia (Lewis 
y Sullivan, 1985). En un estudio, la simple ha- 
bituacidn visual a un estfmulo novedoso (me- 
dida por la duracidn de la fijacidn), evaluada a 
los tres meses dc edad, se correlaciond en .61 
con la puntuacidn obtenida cn la Escala Men¬ 
tal de las escalas Bayley a los 24 meses de edad 
(Lewis y Brooks-Gunn, 1981). Con un para¬ 
digms similar, Fagan ha informado de resulta¬ 
dos comparables (Fagan, 1984; Fagan y 
Shepherd, 1986). Por ejemplo, en un estudio, 
este investigador someti6 a prueba con el mi- 
todo de habiluaci6n la memoria de reconoci- 
miento de lactantes a las edades de 4 a 7 meses 
(Fagan y McGrath, 1981). En este estudio, los 
lactantes observaron primero una fotograffa del 
rostro de un bebd durante un periodo corto y 
despues se les mostrd la misma fotograffa jun¬ 
to con una desconocida (p. ej., la imagen de 
un hombrecalvo). Los investigadores llevaron un 
registro cuidadoso de cuil era la fotograffa que 
los lactantes miraban mis; la Idgica detris del 
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procedimiento es sencilla: Mirar principalmcn- 
is |a nueva fotograffa significa quc el lactante 
jeconocc la anterior; es decir, un lactante con 
buena memoria de reconocimiento prcfiere mi¬ 
rar algo nuevo. Por tanto, la prefcrencia por la 
novcdad —corno se midc a travds del tiempo 
de fijacidn visual en la nueva imagen— se vuel- 
ve un fndice de la memoria inicial de reconoci- 
miento. Anos despuds, los investigadores 
aplicaron la Peabody Picture Vocabulary Test 
(Prueba Peabody de Vocabulario con Figura; 
PPVT) para estimar la inteligencia en la infan- 
cia temprana. Las puntuaciones de memoria de 
reconocimiento en la lactancia y las puntuacio¬ 
nes er la PPVT en la infancia temprana se 
correlacionaron en .37 a los cuatro anos de edad 
y en .57 a los siete. Es probable que estas co- 
rrelaciones subestimen la validez predictiva de 
las pruebas de memoria para lactantes, en el 
sentido de que cl fndice de memoria en la lac¬ 
tancia fue un procedimiento poco confiable 
basado en un pequeno numero de reactivos de 
prueba. Lo quc es mds, los investigadores eva- 
luaron a lactantes normales, lo cual diminuyd 
las corrclacioncs entre el medio de prediccidn 
y cl criterio. 

Las medidas cognitivas para lactantes 
representan una gran promesa como medios de 
prediccidn de la inteligencia en la infancia 
(Bornstcin, 1994; Fagan y Haiken-Vasen, 
1997). En los siguientes anos se podrfa ser tes- 
tigo del surgimiento de tipos completamente 
nuevos de instrumentos de evaluacidn para 
lactantes que se basen en la medici6n de la 
memoria temprana, habituacidn y capacidades 
de atencidn, en lugar de las capacidades senso- 
riomotoras. Un primer paso en esta direccidn 

Uresumen _ 

1. El periodo de la lactancia y de la edad prees¬ 
colar se extiende desde cl nacimiento hasta 
aproximadamente los seis anos. Una apli- 
cacidn importante de las pruebas con 
lactantes y precscolares consiste en ayudar 
a responder preguntas sobre demoras del 


es la Fagan's Test of Infant Intelligence (Prue¬ 
ba Fagan de Inteligencia para Lactantes; Fagan 
y Shepherd, 1986), que es un instrumento sen- 
cillo basado en los mdtodos antes descritos para 
la medici6n dc la preferencia por la novedad 
y la memoria de reconocimiento de los lac¬ 
tantes. Esta prueba produce una puntuacidn 
mixta que se basa en la prefcrencia por la no¬ 
vedad —como se midc a travds del tiempo de 
fijacidn visual en una nueva imagen— prome- 
diada en varios ensayos. El procedimiento mues- 
tra una concordancia intercalificadores muy alta 
(O'Neill, Jacobson y Jacobson, 1994). 

Los estudios inicialcs sobre la validez de 
la Fagan s Test of Infant Intelligence (FTII) 
como medio de prediccidn de la inteligencia en 
la infancia han obtenido resultados mixtos. En 
una mucstra de 200 lactantes, las puntuaciones 
de la FTII obtenidas entre los 7 y 9 meses de 
edad se correlacionaron sdlo en .32 con el Cl 
de la Stanford-Binet a la edad de ires aflos 
(DiLalla, Thompson, Plomin y colaboradorcs, 
1990). En otro cstudio recicnte, las coiTelacio- 
nes globales entre las puntuaciones dc la FTII, 
obtenidas dc los 7 a los 9 meses de edad, y el 
Cl del WPPSI-R a los cinco afios de edad, se 
colocaron alrededor del .2 en dos muestras no- 
ruegas de nifios sanos (Andersson, 1996). Es¬ 
tas correlaciones no prestan apoyo al cmplco 
de la prueba como herramienta de deteccidn en 
poblaciones que no se consideren en riesgo. Sin 
embargo, la prueba puede funcionar mejor si 
se le utiliza con lactantes en riesgo. Dc todas 
mancras, se requiere mayor invcstigacidn an¬ 
tes de abandonar las medidas tradicionales para 
lactantes en favor de la prueba Fagan y otros 
mdtodos similares. 


desarrollo. La mayor parte de las pruebas 
con lactantes (desde el nacimiento hasta los 
, dos ados y medio) tienen cargas notables 
en habilidades scnsoriales y motoras. Las 
pruebas para preescolares (2 anos y medio 
a 6 anos de edad) tienden a dirigirse en 
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grado significativo hacia las habilidades 
cognitivas. 

2. Los Inventarios Gesell del Desarrollo (GDS) 
esliman el progreso rclacionado con el dc- 
sarrollo de lactantes desde las cuatro sema- 
nas hasta los 60 meses de edad. 

3. Las Ordinal Scales of Psychological Deve¬ 
lopment se disefiaron como una medida con 
fundamentacidn piagetiana del desarrollo 
intelectual (desde las 2 semanas hasta los 
2 meses de edad). Las escalas miden el 
desarrollo de la permanencia de objeto, me- 
dios-fines, imitacidn vocal y de ademanes, 
causalidad operational, relaciones objctales 
en el espacio y esquemas para relacionarsc 
con los objetos. 

4. Las Bayley Scales of Infant Development-U 
evaluan el desarrollo mental y motor de ni¬ 
fios de 1 a 42 meses de edad; tienen una 
estandarizacidn cuidadosa y son sumamente 
confiables. Como en otras pruebas para 
lactantes, las puntuacioncs muy bajas pre- 
diccn un rcsultado de discapacidad intelec¬ 
tual en la infancia posterior, mientras las 
puntuaciones cercanas a la norma y supe- 
riores tienen poca validez predictiva. 

5. La Escala Wechsler de Intel igencia para los 
Niveles Preescolar y Primaria-Revisada 
(WPPSI-R) sc disefid para nifios de 3 a 7 
afios, 3 meses de edad. El WPPSI-R con- 
tienc ires subpruebas que no se encuentran 
en otras Escalas Wechsler: Frases (memo- 
ria oral), Disefios geomdtricos (copia de 
disefios) y Casa de los animales (asignacidn 
codificada de clavijas). 

6. La Escala de Inteligencia Stanford-Binet: 
Cuarta Edicidn (SB:CE) es un inslrumento 
util para la evaluacidn preescolar. Aunque 
la prueba sc disefid para producir puntua¬ 
ciones en cuatro factores, la solucidn de dos 
factores de Sattler (1988) para el informe 
de las puntuacioncs de la SB:CE (Compren- 
sidn Verbal y Razonamiento No Verbal/Vi- 
sualizacidn) es el enfoque preferido con 
preescolares. 

7. La Baterfa de Evaluacidn Kaufman para Ni¬ 
fios (K-ABC), que se emplea con nifios des¬ 


de los 2 afios y medio hasta los 12 afios, 5 
meses de edad, es una medida combi nada 
dc inteligencia y rendimiento que se basa 
en la distincidn entre procesamicnto se- 
cuencial (ordenacidn en scrie o temporal de 
los estfmulos) y procesamicnto simultaneo 
(sfntesis y organizacidn de los estfmulos en 
forma inmediata o global). 

8. Las Escalas McCarthy de Aptitudes y 
Psicomotricidad para Nifios sc disefiaron 
para nifios desde los 2 afios y medio hasta 
los 8 afios y medio. Las 18 subpruebas pro- 
ducen cinco subpuntuaciones diferentes y 
un fndice Cognitivo General (ICG) similar 
a un Cl. Las subpuntuaciones incluyen las 
escalas verbal, perceptual-ejecucidn, cuan- 
titativa, memoria y motora. Por desgracia, 
estas cinco Areas no se han confirmado a 
traves de andlisis factorialcs independientes. 

9. Disefiadas para nifios de 2 afios y medio a 
17 afios, 11 meses de edad, las Differential 
Ability Scales constan de 17 subpruebas 
cognitivas y tres pruebas de rendimiento, 
conormadas, que se dirigen a nifios en edad 
escolar. La investigacidn inicial indica que 
la DAS produce puntuaciones confiables y 
razonablemente independientes dc subpruc- 
ba utiles para la evaluacidn de la discapa¬ 
cidad para el aprendizaje. 

10. En general, las puntuaciones de pruebas 
para lactantes se correlacionan en senti- 
do positivo, pero ddbilmente, con aqucllas 
de pruebas para nifios. Las puntuacioncs de 
pruebas para lactantes deben interpretarse 
con precaucidn. Una excepcidn la consti- 
tuyen las puntuaciones muy bajas en ins- 
trumentos como la Bayley-II, la cual predice 
de manera confiable la incapacidad del de¬ 
sarrollo en la infancia. 

11. Las pruebas de memoria de reconocimien- 
to en la lactancia pareccn prometedoras 
como medios de prediccidn de la inteligencia 
en la infancia. Por ejemplo, en los estudios 
de Fagan, los indices de la habituacidn vi¬ 
sual simple en la lactancia se correlacionan 
en .57 con las puntuaciones de vocabulario 
con figura a los sicte afios de edad. ■ 
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Tema 6A 

Pruebas individuales de inteligencia 


Orienlaci6n hacia las pruebas individuales de inteligencia 
Escalas Wechsler de inteligencta 
Subpruebas Wechsler: descripcibn y anblisis 
Escala Wechsler de inteligencia para adultos-lll 
Escala Wechsler de inteligencia para el nivel escolar-lll 
Escala de inteligencia Stanford-Binet: Cuarta Edicion 
Pruebas Detroit de aptitud para el aprendizaje-4 
Test breve de inteligencia de Kaufman (K-BIT) 

Resumen 

Tbrminos y conceptos clave 


El examen dc la inteligencia es uno de 
los principales logros de la psicologfa de este 
siglo. En rcspuesta al bxito de las escalas Binet- 
Simon a principios del siglo XX, los psicdlogos 
desarrollaron y dcpuraron docenas de pruebas 
individuales de inteligencia diseriadas con base 
cn este instrumento innovador. Tambidn se 
observd un gran crecimiento en las pruebas 
grupales de inteligencia, fomentadas por la en- 
tusiasta aeeptacion de las pruebas Army Alfa y 
Beta durante y despuds de la primera Guerra 


Mundial. S61o con algunas excepciones, las 
pruebas actuales de inteligencia, tanto individua¬ 
les como grupales, son herederas de Binet, Simon 
y del programa de pruebas del ejdrcito. 

El propdsito de este capftulo consiste en 
proporcionar una revision de los enfoques m4s 
importantes en cuanto a pruebas individuales y 
grupales de inteligencia. En el Tema 6A se re- 
visan las pruebas individuales sobresalientes y 
se termina el capftulo con una resena de las 
pruebas grupales de inteligencia cn el Tema 6B. 
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Aunque esta obra dedica ties capftulos com- 
pletos al fascinante y emocional tema del examen 
de la inteligencia, no se afirma que la cobertura 
sea exhaustiva. Un analisis completo de las prue- 
bas de inteligencia se encuentra simplemente 
mis alii del campo de accidn de dsta o cualquier 
otra referencia bisica. Casi cada mes aparccen 
pruebas nuevas y revisadas, y cada afio se pu¬ 
blican miles de novedosos descubrimientos de 
investigacidn. Aquf se resenan las pruebas mis 
utilizadas o que ilustran avances intcresantes 
en la teorfa o el mdtodo. Los lectores pueden 
cncontrar informacidn acerca de pruebas adi- 
cionales en la scric del Mental Measurements 
Yearbook, que ahora publica cada 3 o 4 anas el 
Bums Institute (p. ej., Mitchell, 1985; Conoley 
e Impara, 1995; Conoley y Kramer, 1989, 
1992). La Encyclopedia of Human Intelligence 
(Sternberg, 1994) tambidn es una buena fuentc 
de informacidn acerca de las pruebas individua¬ 
ls y grupales de inteligencia. 


I orientaci6n hacia 

LAS PRUEBAS INDMDUALES 
DE INTEUGENC1A 

Las pruebas individuates de inteligencia revi¬ 
sadas en este tema incluyen las siguientes: 

• Escala Wechsler de inteligencia para adul- 
tos-III (WAIS-R) 

• Escala Wechsler de inteligencia para el nivel 
cscolar-111 (WISC-IU) 

• Prueba de inteligencia Stanford-Binet: Cuar- 
ta Edicidn (SB:CE) 

• Detroit Test of Learning Aptitude-4 (DTLA-4; 

Prueba Detroit de Aptitud para el Aprendizaje) 
• Test Breve de Inteligencia dc Kaufman (K-BIT) 

Otro instrumento prometedor que no se revisa 
es Kaufman Adolescent and Adult Intelligence 
Test (KA1T; Prueba Kaufman de Inteligencia 
para Adolescentes y Adultos). Publicada en 
1992, la KAIT ha llegado recientemente al es- 
cenario de las pruebas (Dumont y Hagberg, 


1994; Shaugnessy y More, 1994). Kaufman y 
Kaufman (1997) enumcran varias ventajas de 
la KAIT, incluyendo su fundamentacidn psico- 
mdtrica en la distincidn G t -G ( propuesta por 
John Hom y sus seguidores. La KAIT tambiln 
es atractiva por su brevedad: la prueba propor- 
ciona Indices sumamente confiables de inteli¬ 
gencia en dos terccras partes del tiempo que se 
requierc para la mayor parte dc las baterfas. 
Junto con las pruebas preescolares presentadag 
en tema anterior, es probable que los instrumen- 
tos antes listados expliquen 98 % de las evalua- 
ciones intelectuales rcalizadas en EU A. 

Las escalas Wechsler han dominado las 
pruebas de inteligencia en afios recientes, pero 
dc ninguna manera son las linicas opciones via- 
bles de evaluacidn individual. Muchos otros 
instrumentos miden igualmente bicn la inteli¬ 
gencia general —incluso algunos dirfan que 
mejor. Considdrense las implicaciones de la 
siguiente observacidn, ahora familiar, de que 
en muestras grandes y hctcrogdneas, las pun- 
tuaciones en cualesquiera dos instrumentos 
cstablecidos (p. ej.. escalas Wechsler, Stanford- 
Binet, McCarthy, Kaufman, etc.) se correla- 
cionan por lo comun de 0.80 a 0.90. Con 
frecuencia, la correlacidn entre dos instrumen¬ 
tos establecidos es casi tan alta como la corre- 
lacidn test-retest para cualquier instrumento por 
sf solo. Cuando el propdsito es obtencr una 
puntuaci6n global, parccerfa que cualquier 
prueba de inteligencia cstablecida y con nor- 
mas adecuadas serfa suficiente. 

Pero obtener una puntuacidn total no es la 
unica meta de la cvaluacidn. Ademds, por lo 
general, el examinador desea comprender el 
funcionamienlo intelectual del individuo. Para 
este propdsito, el Cl total es importante, pero 
existen casos donde la puntuacidn global puede 
ser irrelevante o incluso engaflosa. Para compren¬ 
der el funcionamienlo intelectual de alguicn, el 
examinador tambidn deberfa revisar las puntua- 
cioncs de subprueba en busqueda de hipdtesis 
que podrfan explicar el funcionamienlo unico 
de ese individuo. Por supuesto, los examinado- 
res necesitan emprender de manera cauta el 
an&lisis de subpruebas, con hallazgos basados 
en la investigacidn acerca de la naturaleza y 
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gjgnificado de la dispersidn de las subpruebas en 
el caso de la prueba utilizada (Gregory, 1994b; 
McLean, Kaufman y Reynolds, 1989; 
McDermott, Fantuzo y Glutting, 1990). 

Si el objetivo del examinador consiste en 
comprender el funcionamiento intelectual y no 
sdlo determinar una puntuacidn total, las dife- 
rencias cntre pruebas se vuelven bastante rea¬ 
les. Todo instrumcnto aborda la medicidn de la 
inteligcncia desde una perspectiva difcrentc y 
produce un conjunto distintivo de puntuaciones 
de subprueba. Adem&s, una prueba adecuada 
para un caso especffico, podrfa tener un des- 
empeno totalmente inadecuado en olro contcx- 
to. Por ejemplo, el WAIS-R tiene un desempeno 
admirable en el examen del retraso mental leve, 
peroconticne muy pocos reactivos simples para 
la evaluacidn de personas con discapacidades 
del desarrollo de modcradas a graves. 

Un axioma central de la evaluacidn es que 
la eleccidn de un instrumento de prueba debe 
basarse en el conocimiento de sus fortalezas y 
debilidades, segun conciemen a la pregunta de 
referenda. Dicho de manera sencilla, ;el exa¬ 
minador hAbil no depende a ciegas de una sola 
prueba para todos los casos que se le refieren! 
En vez de ello, elige de manera flexible uno o 
mSs instrumentos, segun las necesidades de 
evaluacidn que percibe en el individuo a exami- 
nar. Cada una de las pruebas que se analizan en 
estc tema tienen sus mdritos especiales y tambien 
sus deficiencias particulares. El usuario debe co- 
nocer estas facetas a fin de elegir el instrumen¬ 
to mis adecuado para cada referenda unica. 


ESCALAS WECHSLER 
DE INTELIGENCIA 


F-n el decenio de 1930, David Wechslcr, un psi- 
cdlogo del Bellevue Hospital de la ciudad de 
Nueva York, concibid una serie de instrumen¬ 
tos de gran sencillcz que finalmente dcfinieron 
las pmebas de inteligencia desde mediados has- 
ia finales del siglo XX. Su influenc'd sobre el 
examen de la inteligencia se vc superada sdlo 
por las contribuciones innovadoras de Binet y 


Simon. Es adecuado comenzar el estudio de las 
pruebas individuales con un resumen de la tra- 
dicion de Wechsler, seguido de un andlisis de 
los instrumentos en sf. 

ORIGENES DE LAS PRUEBAS WECHSLER 

Wechsler comenzd a trabajar en su primera 
prueba en 1932, buscando disenar un instru¬ 
mento adecuado para examinar a los diversos 
pacicntes que se referfan a la seccidn psiquiA- 
trica del Bellevue Hospital en Nueva York 
(Wechsler, 1932). Posteriormcnte, al describir 
cl desarrollo de su primera prueba, escribid que 
“nuestra meta no era producir un conjunto de 
pruebas totalmente novedosas, sino sclcccionar, 
de cualquier fuente disponible, una combina- 
cidn de ellas que satisfaciera los requisitos de 
una escala eficaz para adultos" (Wechsler, 
1939). De hecho, el contenido de sus escalas 
se inspird en gran medida en las pruebas Army 
Alfa y Beta (Frank, 1983). Quienes han lefdo 
de manera detenida el libro Psychological 
Examining in the United States, editado por 
Yerkes (1921) justo despuds de la primera Gue¬ 
rra Mundial, podrfan sorprenderse de descubrir 
que Wechsler se apropid de docenas de reac¬ 
tivos de prueba de esta fuente, muchos de los 
cuales han sobrevivido hasta la actualidad en 
las revisiones contemporilneas de las pruebas 
Wechsler. Este autor no era tanto un genio 
creativo como un individuo prdctico, que dise- 
nd un instrumento nuevo y util a partir de ele- 
mentos sobrantes de los intentos anteriores y 
descontinuados para examinar la inteligencia. 

La primera de las pmebas Wechsler, llamada 
Escalas de inteligencia Wechsler-Bellcvue, se 
publied en 1939. Al anaiizar la fundamentacidn 
para su nueva pmeba, Wechsler (1941) explied 
que los instrumentos cxistentes, como la Stanford- 
Binet, eran deplorablemcntc inadccuados para 
la evaluacidn de la inteligencia adulta. La 
Wechsler-Bellevue se disend para rectificar va- 
rios defectos que se habfan observado en prue¬ 
bas anteriores: 

• Los reactivos de pmeba no tenian atractivo 
para las personas adultas. 
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• Demasiadas preguntas enfatizaban la mera 
manipulacion de las palabras. 

• Las instrucciones enfatizaban la velocidad a 
expensas de la precisidn. 

• Dcpender de la edad mental era irrelevante 
en el caso de pruebas con adultos. 

Para corregir estas deficiencias, Wcchsler di¬ 
sen d su prueba cspecfficamentc para adultos, 
anadid reactivos de ejccucidn para equilibrar 
las preguntas verbales, redujo cl dnfasis en las 
preguntas con lfmite de liempo e inventd un 
nuevo mdtodo para obtener el Cl. En tdrminos 
especfficos, sustituyd la fdrmula comun: 

odad mental 

Cl ■- 

edad cronoldglca 

por una fdrmula nueva rclacionada con la edad 

puntuacldn obtenlda o real 
puntuacldn media esperada para esa edad 

Esta nueva fdrmula se basd en la interesante 
presuposicidn —expresada en forma de axio- 
ma— de que el Cl permanece constantc a me- 
dida que se envejece de manera normal, aunque 
la capacidad intelectual natural pueda cambiar 
o incluso disminuir. La suposicidn de la constan- 
cia de Cl es bdsica para las escalas Wcchsler. 
Como lo expresd cl mismo autor (1941): 

La constancia de Cl es la suposicidn basics de 
todas las escalas donde grades relath/os de Inte- 
llgenda se definen en tdrmlnos de dicho Cl. No 
sdlo es bdsico, sino absolutamente necesario, 
que los Cl sean independientes de la edad en la 
cual se calcutan, debido a que, a menos de que 
dicha suposicidn se mantenga, no es posible un 
esquema permanente de dasificacidn de la inte- 
ligencia. 

Aunque los autores contemporineos de pruebas 
aceptan, en general, la perspectiva de Wechsler. 
es importante destacar que la suposicidn de la 
invarianza del Cl con respecto a la edad es, en 
realidad, una afirmacidn de valores, una eleccidn 
filosdfica, y no necesariamente una caracterfs- 
tica inherente de la naturaleza humana. 


Wechsler tambidn tenia la esperanza de uti- 
lizar su prueba como un auxiliar para el diag. 
ndstico psiquidtrico. Para lograr este objetivo, 
dividid su escala en secciones independientes, 
verbal y de ejecucidn, lo que permitfa que el 
cxaminadorcomparara la facilidad del individuo 
en el uso de palabras y sfmbolos (subpruebas 
verbales) contra su capacidad para manipular 
objetos y percibir patrones visuales (subprue¬ 
bas de ejecucidn). Se consideraba que las gran- 
des diferencias entre capacidad verbal (V) y 
capacidad de ejecucidn (£) ten fan importancia 
diagndstica. De manera especffica, Wechsler 
consideraba que la enfermedad orgdnica del 
cercbro, la psicosis y los trastomos emociona- 
les, daban lugar a un notable patrdn V>E, mien- 
tras que la psicopatfa en adolesccntes y el retraso 
mental leve produefan un fuerte patrdn E >V, 
La investigacidn subsecuente demoslrd muchas 
excepciones a estas reglas diagndsticas simples. 
Sin embargo, la distincidn entre habilidades 
verbales y de ejecucidn ha resultado v&lida y 
util para otros propdsitos, como el andlisis de 
las relaciones cerebro-conducta y cl estudio 
de los efectos del cnvejecimiento sobre la inte- 
ligencia. La divisidn tedrica de Wechsler para 
las subpruebas en secciones verbal y de ejecu¬ 
cidn se clasifica quizi como su contribucidn 
m£s duradera al examen conternporaneo de la 
inteligencia. 

CARACTERISTICAS GENERALES 
DE LAS PRUEBAS WECHSLER 

Si se incluyen las revisiones, David Wechsler y 
sus seguidores produjeron 10 pruebas de inte¬ 
ligencia en un lapso dc aproximadamente 60 
aiios. Una de las principalcs razones para el 
dxito de estos instrumentos fue que cada nueva 
prueba o revisidn permanecid fiel al contenido 
y formato familiares que se introdujeron en la 
Wechsler-Bellevue. Al apegarse a una sola fdrmu¬ 
la exitosa, Wechsler asegurd que los examina- 
dores pudieran cambiar de una prueba Wcchsler 
a otra con un reentrenamiento mfnimo; esto no 
sdlo fue bueno en tdrminos psicometricos, sino 
que tambidn representd una hdbil estrategia de 
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jnercadco, en cl sentido de que garantizd varias 
oencraciones de usuarios de las pruebas. 

Las diversas versiones y ediciones de las 
pruebas Wechsler posccn las siguientes carac- 
tcri'slicas en comun: 


• Pc 10 a 14 subpruebas. El enfoque de sub- 
pruebas multiples permite que el examinador 
analice las fortalczas y debilidades intra- 
individualcs, en lugar de calcular una sola 
puntuacidn global. Como cl lector vert mas 
adclante, el patrdn de puntuaciones de sub- 
prueba puede transmitir informacitin util que 
no es evidente en el nivel global de desempeno. 

• Una Escala Verbal compuesta de 5 o 6 sub¬ 
pruebas y una Escala de Ejecucidn que tambidn 
mcluyc 5 o 6 subpruebas. Con esta divisidn, 
el examinador puede evaluar las habilidades 
de comprensidn verbal y organization percep¬ 
tual por separado. El patrdn de capacidades 
en esios dos factores de inteligencia pue¬ 
de tener relacidn con la integridad funcional 


de los hemisferios izquierdo y derecho del ce- 
rebro, y puede servir como indicacidn de las 
fortalezas y debilidades vocacionales, como 
se analiza mils adelante. 

• Una mdtrica comtin para el Cl y la puntua- 
cidn fndice. La media del Cl y de la puntuacidn 
Indice es de 100 y la desviacidn cstdndar es 
de IS para todas las pruebas y todos los gru- 
pos por edad. Adcm£s, las puntuaciones esca- 
larcs en cada subprueba ticnen una media de 
10 y una desviacidn estdndar de aproximada- 
mente 3, lo cual permite que el examinador 
analice las puntuaciones de subprueba de la 
persona cvaluada en cuanto a fortalezas y 
debilidades relativas. 

• Subpruebas comunes para diferentes edades. 
Por ejemplo, las pruebas preescolar, infantil 
y adulta de Wechsler (WPPSI-R. WISC-III y 
WAIS-III) contienen, todas. un niicleo comun 
con las mismas ocho subpruebas (cuadro 6-1). 
Un examinador que domine la aplicacidn de 
una subprueba esencial en cualesquicra de las 


Cuadro 6-1. Composicidn de subpruebas de las escalas Wechsler 



WPPSI-R 

WISC-III 

WAIS-III 

Escalas Verbales 




Intormacion 

X 

X 

X 

Retencion de Dfgitos 


X 

X 

Vocabulario 

X 

X 

X 

Aritmetlca 

X 

X 

X 

Comprensldn 

X 

X 

X 

Semejanzas 

X 

X 

X 

Frases 

X 



Sucesion de Letras y Numeros 



X 

Escalas de Efecucldn 




Figures Incompletas 

X 

X 

X 

Ordenacion de Dibujos 


X 

X 

Dlsedo con cubos 

X 

X 

X 

Matrices 



X 

Composlcidn de objetos 

X 

X 

X 

Claves/SImbolos y Dfgitos 


X 

X 

Laberintos 

X 

X 


Disefios Goom6tricos 

X 



Busqueda de Sfmbolos 


X 

X 

Casa de los animates 

X 




Not»: Las subpruebas ‘prindpales', comunes a todas las escalas Wechsler, se encuentran en tlpogralla negrila 








218 • Evaluation pslcologica: Hiatoria, prlncipios y aplicadones 


(Capilulo 6) 


pruebas Wcchsler (como la subprueba dc In¬ 
formacibn cn el WAIS-III) puede transferir 
con facilidad esta habilidad a ottos miembros de 
la familia Wechsler de mcdidas intelectuales. 


f ] SUBPRUEB AS WECHSLER: 

iDESCRipgdN y anAhsis 

Wechsler (1939) definib la inleligencia como 
“la capacidad total o global del individuo para 
actuar de manera propositiva, pensar de mane- 
ra racional y manejar de manera eficaz su am- 
biente”. Tambibn crefa que sblo se puede 
conocer la inteligencia a travds de aqucllo que 
le permite hacer a una persona. Por tanto, en el 
diseho de sus pruebas, seleccionb componen- 
tes que representaran un amplio conjunto de 
capacidades subyacentes, dc modo que se pu- 
diera estimar la capacidad intelectual total. Lo 
que es mbs, le pidib a sus pacientes que realiza- 
ran cosas, no sblo que respondieran a pregun- 
tas. Las subpruebas Wechsler son muy diversas 
y con frecuencia dependen de lo que Wechsler 
llamaba “producciones mentales”. 

Se presenta aquf una descripcibn de las 
subpruebas del WISC-I1I y del WAIS-III. Tam¬ 
bibn se analizan las capacidades detectadas por 
cada subprueba y se ofinecen comentarios basados 
en la investigacibn. Se refiere al lector al Tenia 
SB para una descripcibn de las tres subpruebas 
(micas del WPPSI-R (Frases, Disefios Gcomb- 
tricos y Casa de los Animates). Las subpruebas 
verbales se enumeran en primer tbrmino. 

INFORMACION 

En esta subprueba se examina el conocimiento 
real acerca de personas, lugares y fenbmenos 
comunes. Las preguntas para nifios son como 
las siguientes: 

“^Cubntos ojos ticnes?” 

‘YQuibn inventb el telbfono?” 

“iQub produce un eclipse solar?” 

"^Cubl es el planeta mbs grande?" 


Las preguntas para adultos son similares, pe ro 
progresan a mayores nivcles de dificultad. Laj 
preguntas diffeiles en la subpmeba dc Infornu. 
cibn para adultos se asemejan a: 

“iCubl es el elemento mbs combn en el 
aire?” 

“iCubl es la poblacibn mundial?” 

“iCbmo se convierte el jugo de fruta en 
vino?" 

“iQuibn escribib Madame Bovary?” 

Los reactivos de prueba dc Informacibn exa- 
minan los conocimientos generales disponibles 
para la mayorfa de las personas criadas en insti- 
tuciones culturales y sistemas educativos de las 
naciones occidentales industrializadas. De ma¬ 
nera indirccta, esta subprueba mide el aprendi- 
zaje y las habilidades de memoria en el sentido 
de que los sujetos deben retenerel conocimiento 
obtenido de las oportunidades cducativas, for- 
males e informalcs, a fin de responder a los rcac- 
tivos de Informacibn. 

Por lo combn, Informacibn se considera 
como una de las mejores medidas dc capacidad 
general entre las subpruebas Wechsler (Kaufman, 
McLean y Reynolds, 1988). Por ejemplo, el 
manual del WAIS-III seftala que, por lo gene¬ 
ral, Informacibn tiene la segunda o terccra co- 
rrelacibn mbs alta con el Cl Total entre todos 
los 13 grupos por edad (Tulsky, Zhu y Ledbetter, 
1997). Dc manera consistente, Informaci6n 
muestra fuertes cargas en el primer factor iden- 
tiftcado en los anblisis factoriales de las cone- 
laciones de subprueba del WAIS-III (vdasc 
despuds). Con frecuencia, el primer factor se 
denomina Comprensibn Verbal. Sin embargo, 
Informacibn tiende a reflejar la cducacibn for¬ 
mal y la motivacibn para el logro acaddmico 
y, por tamo, puede producir estimados falsos 
de capacidad elevada en el caso de estudiantes 
perpetuos y lectores bvidos. 

RETENCION DE DfGITOS 

Retcncibn de Dfgitos consta de dos pruebas 
independientes, Dfgitos en Orden Progresivoy 
Dfgitos en Orden Inverso. En la primera, el exa- 
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mjnador lee una scric dc numeros a una vcloci- 
dad de uno por segundo y despuds le pide al 
sujeto que los repita. Si el paciente responde 
correctamcnte en dos cnsayos consecutivos de 
la misma extension, el examinador prosigue a la 
siguiente serie que tiene un dfgito adicional, 
hasta una extensidn maxima de nueve dfgitos. 
Para Dfgitos en Orden Inverso se utiliza un pro- 
cedimiento similar, s6!o que la persona exami- 
nada debe repetir los dfgitos en orden inverso, 
hasta una extension maxima dc ocho dfgitos. 
Por ejemplo, el examinador lee: 

“6-1-3-4-2-8-5" 

y la persona trata dc repetir los numeros en or¬ 
den inverso: 

“5-8-2-4-3-1-6” 

Retcncidn de Dfgitos es una medida del recuer- 
do auditivo inmediato de ntimeros. Se requic- 
ren faedidad numdrica, buena atencidn y libertad 
de la distractibilidad. La ansiedad o la fatiga 
pueden afectar el desempefio cn esta subprueba 
y muchos clfnicos han observado que, con fre- 
cuencia, los pacicntes hospitalizados por razo- 
ncs mddicas o psiqui&tricas tienen un 
desempefio deficiente en Retenci6n de 
Dfgitos. 

Ambas pruebas pueden evaluar capacida- 
des fundamentalmente diferentes. Dfgitos en 
Orden Progresivo parece requerir que el indi- 
viduo evaluado acceda en forma secuencial a 
un eddigo auditivo. En contraste, para el des¬ 
empeno en Dfgitos en Orden Inverso, la perso¬ 
na debe formar una huella visual de memoria a 
nivel interno a partir de las secuencias numdri- 
cas presentadas dc modo oral y despuds reco- 
rrer visualmente los numeros del final al 
principio. Esta es, con toda claridad, la prueba 
mds compleja, y no es de sorprender que ten- 
ga una carga m.ls fuerte en inteligencia gene¬ 
ral que Dfgitos en Orden Progresivo (Jensen y 
Osborne, 1979). Gardner (1981) discute que los 
examinadores deberfan complementar los pro- 
cedimientos cstdndar de informe y enumerar 
subpuntuaciones independientes para Rctcncidn 
rle Dfgitos. Este autor presents medias, desvia- 
ciones estdndar y rangos percentiles indepen¬ 


dientes para Dfgitos en Orden Progresivo y 
Dfgitos en Orden Inverso para nifios entre 5 
y 15 afios de edad. 

VOCABULARIO 

Se pide al individuo que defina hasta varias 
docenas dc palabras que tienen un nivel cada 
vez mayor de dificultad, mientras el examina¬ 
dor escribe la respuesta al pie de la letra. Por 
ejemplo, en un reachvo ttcil el examinador po- 
drfa pregunlar ‘Yqud es una laza?”, y la perso¬ 
na evaluada obtendrfa erddito parcial por 
responder: “una cosa para beber”, y erddito 
completo por responder “tiene un asa, conticne 
Ifquido en su interior y bebes de ella". Para los 
adultos y nifios inteligentes, los reactivos avan- 
zados en la subprueba de Vocabulario de 
Wcchsler pueden ser muy desafiantes, al nivel 
dc tintura, vocinglero y atroz. 

El vocabulario se aprcnde en gran medida 
en el contexto de la lectura de libros y al escu- 
char a otras personas. Son pocos los individuos 
que obtienen su vocabulario dc la lcctura del 
diccionario o dc memorizar las listas de pala¬ 
bras de la seccidn de “Aumente sus conocimien- 
tos de palabras” de las revistas populares. En 
tdrminos generales, el vocabulario de una per¬ 
sona es una medida de la sensibilidad a infor- 
macidn nueva y de la capacidad para descifrar 
signiftcados a partir del contexto en el que se 
encuentran las palabras. Precisamente debido 
a que la adquisicidn del significado de una pa- 
labra depende dc la infcrencia contextual, la 
subprueba de Vocabulario resulta ser la mejor 
medida de la inteligencia general entre las es- 
calas Wechsler (Gregory, 1999). Esto sorpren- 
de a muchos legos, quienes consideran que el 
vocabulario es sdlo un sindnimo dc la exposi- 
cidn a la educacidn y, por tanto, un fndice me¬ 
diocre de la inteligencia general. Sin embargo, 
simplemente no es posible negar la evidencia 
cmpfrica: Vocabulario tiene la correlacidn mis 
alta con el Cl Total entre todas las subpruebas, 
tanto en el WISC-III (combinacidn de los gru- 
pos por edad) como en el WAIS-III (para 
grupos de 12 a 13 afios de edad). 






1 


220 • Evaluation pslcologlca: Historla, prtndplos y aplicadones 


(Capilulo 6) 


ARITMETICA 

Excepto por los reactivos mds f&cilcs para niftos 
pequenos o personas con retraso, la subprueba 
de Arilmdtica estd formada por problemas ma- 
temdticos prcsentados de manera oral. El indi- 
viduo cxaminado debe resolver los problemas 
sin papel o ldpiz. dentro dc un Ifmitc de tiempo 
(por lo general 30 o 60 segundos). Los reacli vos 
seneiI los destacan operaciones fundamcntales 
dc suma o resta, por ejemplo: 

“Si tienes 15 manzanas y regalas 7, ^cudntas 
te quedan?” 

Los reactivos mils dificilcs requicren una ade- 
cuada conccptuacidn del problema y la aplica- 
cidn de dos operaciones aritmdticas, por 
ejemplo: 

"John comprd un equipo estereofdnico que te- 
nfa una rebaja de 15 % con rcspccto al precio 
original dc venta dc $600. iCudnto pagd John 
por el equipo estereof6nico?“ 

Aunquc los requisitos matemdticos dc los reac¬ 
tivos de Aritmdtica no son excesivamcntc dc- 
mandantes, la necesidad de resolver los problemas 
a nivel mental dentro dc un Ifmitc de tiempo 
hacc que esta subprueba sea muy desafiante 
para la mayorfa dc las personas examinadas. 
Ademls de las habilidadcs arilmeticas rudimen- 
tarias, el desempeno exitoso en Aritmdtica re- 
quiere altos niveles de concentracidn y la 
capacidad para conservar los cdlculos interme- 
dios dentro de la memoria a corto plazo. En los 
andlisis factorials del WISC-III y del WA1S- 
III, con frccucncia, Aritmetica tienc cargos en 
un tercer factor interpretado ya sea como Li- 
bertad de la Distractibilidad o como Memoria. 

COMPRENSI6N 

La subprueba de Comprensidn es un conjunto 
ecldctico dc reactivos que requieren explicacidn 
mds que conocimiento sobre hechos reales. Las 
preguntas fdciles destacan sentidocomun, micn- 
tras las mds diffciles requieren una comprensi6n 
dc los convencionalismos sociales y culturales. 


En el WAIS-II1, dos de las preguntas mds diff. 
ciles necesitan que la persona examinada inter- 
prctc proverbios: 

Un reactivo fdcil de Comprensidn se pre- 
senta en la siguiente forma: “^Por qud las 
personas utilizan ropa?". Los reactivos diffcj. 
Ics se asemejan a los siguientes: 

“iQud quiere decir este dicho?: ‘Mds vale 
pdjaro en mano que cicnto volando'." 

“^Por qud los jueces del Tribunal Superior 
de Justicia conservan su puesto de por 
vida?" 

Comprensidn parecena ser, en parte, una mc- 
dida dc la “intcligencia social", en cuanto a que 
muchos reactivos se dirigen a la comprcnsidn 
de la persona examinada acerca de los conven¬ 
cionalismos sociales y culturales. Sipps, Berry y 
Lynch (1987) cnconlraron que las puntuacioncs 
de Comprensi6n se relacionaban un poco con 
medidas dc la inteligcncia social en el Inventa- 
rio de personalidad de California. Por supucsto, 
una alta puntuacidn significa s61o que la persona 
conoce acerca de los convencionalismos socia¬ 
les y culturales: la eleccidn de la accidn correcta 
puede provenir o no dc este conocimiento. Sin 
embargo, estudios recientesde Cambell y McCord 
(1996) y Lipsitz, Dworkin y Erlenmeyer- 
Kimling (1993) no cncontraron sustentacidn 
para la crecncia popular de que las puntuacio- 
nes de Comprensidn son sensibles al funciona- 
miento social. 


SEMEJANZAS 

En esta subprueba, al individuo examinadose 
le haccn preguntas del siguiente lipo: “^En qu<£ 
se parecen las camisas y los calcetines?" La 
subprueba de Semejanzas evalua la capacidad 
de la persona para distinguir las semejanzas 
importantes de las no importantes entre obje- 
tos, hechos e ideas. Dc manera indirccta, cstas 
preguntas evaluan la asimilacidn del conccpto 
de simililud. La persona evaluada debe poseer 
tambien la capacidad para juzgar cuando una 
semejanza es importante mds que trivial. Por 
ejemplo, las “camisas" y los “calcetines" se 
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pareccn cn que ambas palabras comienzan 
con la letra “c”, pero dsta no es la semejanza 
esencial cntre ambos artfculos. La similitud 
importante es que las camisas y los calcetines 
son, ambos, casos dc un mismo concepto, es 
dear, “ropa". Como ilustra cste ejemplo, Se- 
mcjanzas puede considerarsc una prucba de 
formacidn de conccptos verbales. 

Ahora se cenlra la atencidn hacia una des- 
cripcidn y anilisis de las subpruebas de Ejecu- 
ci6n de las escalas Wechsler. Con excepcidn 
de Matrices en el WAIS-III, todas las subprue¬ 
bas tienen Ifmite de tiempo, y en la mayor parte 
de cllas se conccdcn puntos de bonificacidn a 
la persona evaluada, con base en un desempe- 
no ripido. 

SUCESION DE LETRAS Y NUMEROS 

Gsta es una nueva subprueba que se cncuentra 
sdlo en el WAIS-III. El examinador presenta 
verbalmcnte una serie de letras y numeros que 
secncuentran en orden aleatorio. El examinan- 
do debe volver a ordenar y repetir la lista di- 
ciendo los numeros en orden ascendcnte y 
despuds las letras en orden alfabdtico. Por ejem¬ 
plo, si el examinador dice “R-3-B-5-Z-1-C”, el 
examinado debe responder “1-3-5-B-C-R-Z.” 
Esta subprueba mide atencidn, concentracidn y 
libcitad de la distractibilidad. Junto con Aritmd- 
tica y Retencidn de Dfgitos, esta subprueba con- 
tribuye a la puntuacidn del fndice de Memoria 
Simultanea en el WAIS-III (vdase despuds). 

F1GURAS INCOMPLETE 

Para esta subprueba, el examinador pide al in- 
dividuo que identifique la “parte importante” 
que falta en una ilustracidn. Por ejemplo, un 
rcactivo simple podrfa scr de este tipo: un di- 
bujode una mesa a la que le falta una pata. Los 
rcactivos van aumentando en grado de dificul- 
tad; la subprueba continua hasta que la persona 
evaluada falla en cinco reactivos consecutivos. 
La tigura 6-1 represents un reactivo similar a 
aqudllos encontrados en el WAIS-III. 



Figure 6-1. Reactivo de Figures Inoompletas similar a 
los encontrados en el WAIS-III. 


Aunquc figures Incompletas estd incluida 
en la mitadde ejecucidn decada prucba Wechsler, 
las capacidadcs que sc requieren para esta sub¬ 
prueba se superponen s6lo a un nivel modesto 
con las medidas tfpicas de la inteligencia eje- 
cutiva (p. ej„ Diseno con cubos). En primer 
lugar, el desempefto exitoso en Figuras Incom¬ 
pletas implica en gran medida accedera la me¬ 
moria a largo plazo, mis que utilizar la habilidad 
perceptual-manipulativa. Es cierto que la per¬ 
sona examinada debe lener buena atcncidn a 
los detalles visuales, pero las alias puntuacio- 
ncs rcflcjan principalmente la capacidad para 
comparer cada dibujo con objetos o situacio- 
nes similares almacenados en la memoria a lar¬ 
go plazo. En resumen, Figuras Incompletas no 
requiere en rcaiidad dc un componente de eje- 
cucidn. El individuo necesita verbalizar el ele- 
mento faltante o sdlo sefialar a la secci6n del 
dibujo que presenta una anomalfa. La subprueba 
de Figuras Incompletas presupone que la per¬ 
sona evaluada se ha visto expuesta al objeto o 
situacidn representados, por tal razdn, puede ser 
inapropiada para personas que no han tenido 
acceso a las ventajas culturales. 
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ORDENACION DE DIBUJOS 

En esta subprueba, el examinador coloca en des- 
orden varios recuadros dc una lira de caricatu- 
ras no verbales. La (area dc la persona evaluada 
consiste en colocar los recuadros juntos en el 
orden correcto, a fin de describir una historia 
que tenga sentido. La figura 6-2 prcsenta una 
tarea dc ordenacibn de dibujos como la quc 
podrfa encontrarse en el WAIS-III. 

Aunque Ordenacibn de Dibujos se agrupa 
junto con las tareas de ejecucibn, ticne cargas 
aproximadamcnte iguales en los componentes 
verbal y de ejecuci6n revelados en los cstudios 
analftico-factoriales de intercorrelacibn de sub- 
pruebas (p. ej., Silverstein, 1982a). Las capaci- 
dades detectadas son complejas y multifacb- 
ticas. Antes dc ordcnar los dibujos, la persona 
examinada dcbc tcner la capacidad de desci- 
frar la gestalt de la historia correcta, a partir de 
sus elemcntos desordenados. Esta subprueba 
tambibn mide pensamicnto secuencial y la capa¬ 
cidad para ver relaciones entre acontecimientos 
sociales. En el WAIS-III, varias dc las historias 
de Ordenacibn dc Dibujos tienen temas humo- 
rfsticos. Como resullado, se requiere de refina- 
miento social y sentido del humor para tener 
un desempefio exitoso. 

DISENO CON CUBOS 

En la subprueba de Diseno con Cubos, la per¬ 
sona debe reproducir disenos geombtricos bidi- 


mensionales a travbs de la rotacibn y coloca. 
cibn correctas de cubos tridimensionales de co- 
lores. Esta subprueba se presenta en el Tenia 
2B, Proceso de prueba. En todas las escalaj 
Wechsler, los primeros reach vos de Disefio con 
Cubos pueden resolverse mediante tanteo. 
Sin embargo, los reactivos mbs diffciles nece- 
sitan del anblisis de relaciones espaciales, coor- 
dinacibn visomotora y aplicacibn rfgida dc la 
Ibgica. Disefio con Cubos demanda mucha 
mayor capacidad de solucibn de problemas y 
de razonamiento quc la mayor parte de las 
subpruebas de ejecucibn, dondc la memoria y 
la experiencia previa tienen mayor pondcraci6n, 
En los anblisis factoriales dc las cscalas Wechsler, 
Disefio con Cubos tiene por lo comun la carga 
mbs elevada de todas las subpruebas dc ejecu¬ 
cibn en el segundo factor. feste se idcntifica de 
diversas maneras como factor no verbal, visoes- 
pacial o inteligencia perceptual-organizacional 
(Fowler, Zillmer y Macciocchio, 1990; Sil veretcin, 
1982a). En el WISC-ID y en el WAIS-III. Disefio 
con Cubos ticne la correlacibn mbs alia con cl 
Cl dc ejccucibn para casi todos los grupos de 
estandarizacibn entre las edades dc 6 y 89 afios, 
Por esta razbn, en general se rcconoce a Dise¬ 
fio con Cubos como el fndice quintaescncial de 
la inteligencia no verbal en las pruebas Wechsler 
(Gregory, 1999). 

Esta es una prueba en la quc tienen gran 
importancia los Ifmites de tiempo. Considbrese 
la versibn del WAIS-R, que consta de 14 diseflos 





Figura 6-2. Reactlvo de Ordenacidn de Dibujos similar a los encontrados en el WAIS-III. 
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de dificultad progresiva. Para obtcner una aha 
puntuaci6n, los adultos no s6lo deben repro¬ 
ach correctamente cada uno de los 14 disc¬ 
os, sino que tambidn deben obtener una 
bonificacidn en los ultimos cinco disenos al 
lerminarlos con rapidez. Una persona que re¬ 
ceive todos los disenos dcntro del Ifmite de 
tiempo. pero que no puede obtener los puntos 
debonificacidn, lendid una puntuacidn exacta- 
m ente dentro del promedio en esta subprueba. 
Las puntuaciones de Diseno con Cubos puc- 
denserenganosasen el casode individuosexa- 
minados que no valoran la ejecucidn veloz. 

MATRICES 

Matrices es una nueva subprueba que se en- 
cuentra sdlo en el WAIS-III. Se ariadiri para 
mejorar la evaluacidn del razonamiento no ver¬ 
bal en la prueba para adultos. La subprueba 
consiste en 26 problemas de razonamiento fi- 
gurativo dispuesto en orden de dificultad cre- 


ciente (figura 6-3). Para encontrar la respuesta 
correcta, la persona evaluada tiene que identi- 
ficar un patrdn o relacidn recurrente entre los 
estfmulos figurativos dibujados a lo largo de 
una lfnea recta (reactivos sencillos) o en una 
rejilla de 3 x 3 (reactivos diffeiles) en los que 
falta el ultimo elemento. Con base en el razo¬ 
namiento no verbal acerca de patrones y rela- 
ciones, la persona debe inferir el estfmulo 
faltante y seleccionarlo de entre cinco opcio- 
nes que se proporcionan en la parte inferior de 
la (arjeta. 

Matrices se disefid para constituir una 
medida de la inteligencia fluida, que es la ca- 
pacidad para realizar opcraciones mentales 
como la manipulacidn de sfmbolos abstractos. 
Los reactivos detectan integracidn de patrones, 
razonamiento por analogia y razonamiento en 
serie. En general, la subprueba es una cxcelen- 
te medida del razonamiento inductivocon base 
en estfmulos figurativos. Matrices es la unica 
subprueba de ejecucidn sin Ifmite de tiempo 
dentro del WAIS-III. 


OOQ 



Figura &~3. Reactivo de Matrices similar a los encontrados en el WAIS-III. 
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COMPOSICION DE OBJETOS 

Para cada reactivo, la persona evaluada debe 
armar las piezas de un rompecabezas para for- 
mar an objeto comun (figura 6-4). Por ejem- 
plo, Composici6n de objetos cn cl WAIS-III 
consiste en cinco rompecabezas: un maniquf 
(seis piezas), un perfil (siete piezas), un elefan- 
te (seis piezas), una casa (nuevc piezas) y una 
mariposa (siete piezas). El examinador no iden- 
tifica los reactivos, de modo que la persona 
evaluada debe discernir primero cl objeto para 
identificar cada reactivo a partir de sus partes 
desordenadas. El dxito en csta subprueba re- 
quiere altos niveles de oiganizacidn perceptual; 
es decir, la persona debe captar el patrdn general 
o gestalt, con base en la percepcidn de las rela- 
ciones entre las partes individuates. 

Composicidn de Objetos es la menos con- 
fiable de las subpruebas Wechslcr. Por ejem- 
plo, en cl WAIS-III esta subprueba tienc una 
correlacidn corregida de divisidn cn mitadcs de 
.70 (Tulsky, Zhu y Ledbetter, 1997). Entre las 
subpruebas WAIS-III, s61o Ordenacion de Di- 
bujos con un valor de .74 se acerca a la falta de 
confiabilidad de Composici6n de Objetos. Es- 
tas dos subpruebas se dcstacan de las otras 
subpruebas Wechsler, que son mis confiables. 
La mediocre confiabilidad de Composicidn de 
Objetos puede reflejar, en parte, el pequcfto 
numero de reactivos al igual que la funcidn de 
los factores aleatorios en la solucidn de rompe¬ 
cabezas. 


Figura 6-4. Reactivo de Composldbn de Objetos simi¬ 
lar a ios enoontrados en el WAIS-III. 


CLAVES O SIMBOLOS Y DIGITOS 

Aunque las tareas son casi iddnticas, esta 
subprueba se denomina Claves en el WISC-II] 
y Sfmbolos y Dfgitos en el WAIS-III. La ver. 
si6n del WISC-III consta de dos partes separa- 
das y distintas, una para niiios mcnores a echo 
afios (Claves A) y otra para nifios de ocho afios 
en adelante (Claves B). En Claves A, cl nifio 
debe dibujar el sfmbolo correcto dentro de uni 
serie de formas en secuencia aleatoria. La tarea 
utiliza cinco formas (cstrella, cfrculo, tndngu. 
lo, cruz y cuadrado) y a cada forma se le asigm 
un sfmbolo tinico (lfnca vertical, dos lfneasho- 
rizontalcs, una sola li'nea horizontal, cfrculo y 
dos Ifneas verticales, respectivamcnle). Despuifj 
de una breve sesidn de prictica, se le pide a] 
nifio que dibuje el sfmbolo correcto dentro de 
43 de las formas cn secuencia aleatoria. Sin 
embargo, dado que existe un Ifmite de tiempo 
de dos minutos, las puntuaciones alias requie- 
ren un desempefio rdpido. 

Claves B en el WISC-III y Sfmbolos y 
Dfgitos del WAIS-III son iddnlicas en formato 
(figura 6-5). Para ambas subpruebas, cl indivi- 
duo examinado debe relacionar un sfmbolo con 
cada uno de los dfgitos del 0 al 9 y dibujar 
con rapidez el sfmbolo apropiado debajo de 
una larga serie de dfgitos aleatorios. El Ifmite 
de tiempo para ambas versiones es de dos mi¬ 
nutos. Muy pocos examinados se las arreglan 
para codificar todos los estfmulos dentro de este 
tiempo. 

Estes (1974) analizd la subprueba de Sfm¬ 
bolos y Dfgitos desdc la postura de la tcorfa 
del aprendizaje y concluy6 que el desempeiio 
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Figura 6-5. Reactivos de Sfmbolos y Dfgitos similar* 
a los enoontrados en el WAIS-lll. 
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eficaz requierc la capacidad para producir con 
r #pidez claves verbales para represenlar cada 
u no de los sfmbolos dentro dc la mcmoria. Por 
ejemplo. en la figura 6-5 la persona examinada 
podn'a codificar el sfmbolo bajo el numcro dos 
como “T invertida”. La codificacidn verbal 
media el desempefio rdpido al simplificar la ta- 
tea. El desempeno eficicntc tambidn deman- 
da aprendizaje inmediato de los pares de 
sfmbolos-dfgitos, de modo que la persona no 
tenga que buscar cada dfgito en el cuadro de 
referenda para delerminar la respucsta correc¬ 
ts. En estc sentido, Sfmbolos y Dfgitos es sin¬ 
gular: es la dnica subprueba Wechsler que 
necesita de aprendizaje en cl momento de una 
tarea no familiar. 

Las puntuaciones de Sfmbolos y Dfgitos 
muestran una disminucidn pronunciada a mc- 
dida que se avanza en edad. En estudios 
transversales, las puntuaciones naturales en 
Sfmbolos y Dfgitos declinan hasta 50% de los 
20 a los 70 afios de edad (Wechsler, 1981). La 
disminucidn es aproximadamente lineal y no 
se explica con facilidad a travds de referencias 
superficiales a las diferencias motivacionales o 
a la lentificacidn motriz. Por supuesto, los re- 
sultados transversales no son sindnimos por 
necesidad dc las tendencias longitudinales. Sin 
embargo, la disminucidn con la edad en Sfm¬ 
bolos y Dfgitos es tan pronunciada que debe 
indicar. en parte, un verdadero cambio relacio- 
nado con la edad en la velocidad de las habili- 
dades bdsicas de procesamiento de informacidn. 
tsta es una de las subpruebas mis sensibles a 
. loscfectos del deterioro orginico (Lezak, 1995). 

iaberintos 

Ml subprueba sdlo aparecc en cl WPPSI-R Y 
WISC-UI, y consiste en Iaberintos de lipiz 
y papel que el nifio debe resolver dentro de un 
Ifrnite de tiempo. Al individuo evaluado se le 
pide que no lcvante el lipiz y sc le aconseja 
l ! uc “interne no entrar en callejones sin salida”. 
Se da erddito completo para cada laberinto si el 
n >no lo resuelve dentro del lfmite dc tiempo (30 
a I50scgundos, dependiendo de la dificultad) 


sin entrar en algun callejdn sin salida. Se rcsta 
un punto dc punluacidn natural por cada vez 
que Itaya entrado en un callejdn sin salida. 

La subprueba de Laberintos detccta habili- 
dades perceptomotoras, velocidad motora, pla- 
nificacidn visual y la capacidad para inhibir las 
respuestas impulsivas. Esta subprueba es una 
medida deficiente de la inteligencia general, 
pero mide razonablemente bien la organizacidn 
perceptual. En el W1SC-I1I, Laberintos es una 
subprueba complementary que no se utiliza 
para el c&Iculo del Cl. 

BUSQUEDA DE SfMBOLOS 

La Busqueda de Sfmbolos es una medida com¬ 
plementary de ejecucitSn que se encuentra en 
el W1SC-III y el WA1S-III. Es una subprueba 
con fuerte influencia de los Ifmites de tiempo, 
en la que el nino observa un grupo bianco de 
sfmbolos, despuds examina con rapidez un gru¬ 
po de busqueda con sfmbolos y finalmente 
marca la casilla de “Sf” o “NO" para indicar si 
uno o mds de los sfmbolos dentro del grupo 
bianco ocurricron dentro del grupo de busque¬ 
da. Un reactivo de Busqueda de Sfmbolos se 
representa en la figura 6-6. Esta subprueba pa- 
recerfa scr una medida de la velocidad de pro¬ 
cesamiento. 


I“® L© •> W =|z 1 sf | | no | 


Not*: La larea de la persona examinada consiste en delerminar 
si cualesquier a de las lor mas que se encuent/an a la izquierda 
ocurro entre las dneo formas de la derecha 


Figura &-6. Reactivo de Busqueda de Slmbolos similar 
a aquellos encontrados en el WISC-lll. 
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I ESCALA WECHSLER DE 

1NTEUGENCIA PARA ADULTOS-III 

El WAIS-III conslituye una revisi6n significa- 
tiva del WAIS-R, aunque se conservd la mayor 
parte dc los rcactivos anteriores. Los cambios 
mds importances incluyen la adicidn de Ires 
subpruebas y de un modelo altemativo para 
calificar la prueba (cuatro puntuaciones fndice 
para complementar el abordaje tradicional de 
Cl Verbal, de Ejecucidn y Total). Otras mejo- 
rfas importantes con respccto a su anteccsor 
incluyen la actualizacidn y expansion dc las 
muestxas normativas, extensidn dc la cobcrtura 
hasta los 89 aiios de edad, adicidn dc rcactivos 
fdciles para mejorar la evaluacidn del retraso 
mental y establceimiento de normas comparti- 
das con la Escala Wechsler de Memoria-III 
(Gregory, 1999). Debido a los cambios en los 
protocolos del WAIS-I1I (p. ej., prescntaci6n 
dcstacada dc reglas de dcscontinuacion), csta 
prueba es un poco mis fAcil de aplicar que el 
WAIS-R. Saltier y Ryan (1999) proporcionan 
una resena sobresalicnte accrca del WAIS-III 
en la prdctica clfnica. 

El WAIS-III se compone de 14 subpruebas, 
pero una (Composicidn de Objetos) es ahora 
opcional y se Ic utiliza s6lo como sustituto para 
pruebas inutilizadas bajo circunstancias poco 
comunes (Wechsler, 1997). Del conjunto prin¬ 
cipal de 13 subpruebas, 11 son necesarias para 
el cdlculo de los Cl tradicionales (Verbal, Eje- 
cucidn y Total). Las normas para las puntua¬ 
ciones de Cl se establecieron con el promedio 
convencional dc 100 y desviacidn estdndar de 
IS en la poblacidn general. La separacidn 
de las subpruebas para obtener las punluacio- 
nes de Cl es como siguc: 

Cl Verbal 
Vocabulario 
Semejanzas 
Aritmdtica 

Retencidn de Dfgitos 

Informacidn 

Comprensidn 


Cl dc Ejecucidn 
Figures Incompletas 
Claves, Sfmbolos y Dfgitos 
Disefio con Cubos 
Matrices 

Ordcnacidn de Dibujos 

Las 11 subpruebas se utilizan para el cdlculo 
del Cl Total. La division Verbal-Ejccucidn de 
las subpruebas del WAIS-III es casi iddntica a la 
encontrada en cl WAIS-R. La unica diferencia 
es la adicidn de Matrices en lugar dc Composi- 
ci6n de Objetos. 

Ademds de las puntuaciones tradicionales 
dc Cl, en el WAIS-III se pueden obtener pun¬ 
tuaciones en cuatro Indices, cada uno de los 
cualcs se basa en 2 o 3 de las 13 subpruebas. V 
Estos indices sc derivaron del andlisis factorial 
de las subpruebas, el cual reveld cuatro domi- 
nios: Comprensidn Verbal, Organizacidn Per¬ 
ceptual, Memoria Simultdnea y Velocidad de 
Procesamiento. Las puntuaciones fndice lam- 
bi<in se basan en la media familiar de 100 y 
desviacidn estdndar de IS. La divisidn de las 
subpruebas pare las cuatro puntuaciones fndi¬ 
ce es la siguientc: 

fndice dc Comprensidn Verbal 
Vocabulario 
Semejanzas 
Informacidn 

fndice dc Organizacidn Perceptual 
Figuras Incompletas 
Diseno con Cubos 
Matrices 

fndice de Memoria Simultdnea 
Aritmdtica 

Retencidn dc Dfgitos 
Sucesidn de Lctras y Numeros 
fndice de Velocidad de Procesamiento 
Claves, Sfmbolos y Dfgitos 
Busqucda de Sfmbolos 

El lector notard que el fndice de ComprensiWl 
Verbal (ICV) es similar al Cl Verbal, pero no 
incluye subpruebas sensibles a la atencidn (es 


J 
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decir, Retencidn de Dfgitos y Aritmdtica). Por 
tal razdn, el ICV es una medida mis directa de 
|a comprensidn verbal que el Cl Verbal. El fn- 
dice dc Organizacidn Perceptual (IOP) es si¬ 
milar al Cl de Ejecucidn, pero depende menus 
de la velocidad (porque Matrices no tienc lfmi- 
te de tiempo). Por tal razdn, el IOP es una me¬ 
dida mis refinada del razonamiento fluido y de 
la solucidn de problemas visoespaciales que el 
Cl de Ejecucidn. En este sentido, el ICV y 
el IOP son medidas mis “puras" que los Cl Ver¬ 
bal y dc Ejecucidn, respectivamente. 

El fndice de Mcmoria Simultinca (IMS) 
se compone dc subpruebas sensibles a atencidn 
y memoria inmediata (Aritmdtica, Retencidn dc 
Dfgitos y Sucesidn de Letras y Numeros). Una 
puntuacidn relativamente baja en este (ndice 
puede significar que la persona evaluada tiene 
un problema de atencidn o mcmoria. en especial 
con los materiales que se presentan de manera 
verbal. El fndice de Velocidad de Procesamien- 
to (I VP) se compone de subpruebas que requie- 
ren del procesamiento sumainente veloz de 
informacidn visual (Claves, Sfmbolos y Dfgitos, 
Busqueda de Sfmbolos). El IVP es sensible a 
una amplia variedad de padecimientos neuro- 
Idgicos y neuropsicoldgicos (Tulsky, Zhu y 
Ledbetter, 1997). 

ESTAND ARIZAC16N DEL WAIS-III 

La estandarizacidn del WAIS-III se emprendid 
con gran cuidado y se basd en los datos obteni- 
dos por el Bureau of the Census de EUA en 
1995. La muestra total de 2 450 adultos (de 16 
y 89 afios de edad) se cstratificd dc manera es- 
merada en estas variables: sexo, raza, elnicidad, 
nivel de estudios y regidn geogrifica. Se utiliza- 
ron las cifras del censo dc 1995 como los valores 
bianco para las variables de estralificacidn. 

Por cjemplo, entre las personas dentro del 
rango de 55 a 64 afios de edad, cl Departamento 
del Censo encontrd que 3.47% son afroestado- 
unidenscs con educacidn media superior. De aquf 
que el 3.5% de los individuos de estandarizacidn 
dentro de este rango de edades fueron afroesta- 
dounidenses con educacidn media superior. 


La muestra de estandarizacidn sc dividid 
en 13 bandas por edad: 16-17, 18-19, 20-24, 
25-29,30-34,35-44,45-54,55-64,65-69,70-74, 
75-79,80-84,85-89 afios. Excepto para los dos 
grupos de mayor edad, cada muestra incluyd a 
200 participantes cuidadosamente estratificados 
en las variables demogrificas que se scfialan 
antes; el grupo dc 80 a 84 afios de edad incluyd 
a 150 participantes y el grupo de 85 a 89 afios 
incluyd a 100 participantes. La muestra resul- 
tante tiene una corrcspondencia muy estrecha 
con las proporciones del censo de EUA. Sin 
embargo, se excluyd a personas de las que exis- 
tfa la sospecha de un deterioro cognitivo, in- 
cluso leve, de modo que es probable que la mues¬ 
tra sea mis sana que sus equi valentcs del censo. 
En tdrminos espccfficos, se utilizaron varios 
criterios de exclusidn dentro dc la muestra de 
estandarizacidn. incluyendo daltonismo, dete¬ 
rioro auditivo o visual sin corrcccidn, cvidencia 
de problemas con drogas/alcohol, menoscabo de 
extremidades superiores, ulilizacidn de medi- 
camentos ansiolfticos o antidepresivos y una 
variedad de padecimientos potencialmcnte 
discapacitantes a nivel neuroldgico (lesiones 
craneales, embolias, epilepsia, enfermedad de 
Alzheimer, esquizofrenia). 

Aunque el WAIS-III es muy similar al 
WAIS-R y tiene una superposicidn sustan- 
cial en cuanto a los reach vos, ambas pruebas 
no producen Cl similarcs. En estudios contraba- 
lanceados que comparan las puntuaciones dc 
192 adultos en las dos pruebas, las puntuacio¬ 
nes del WAIS-III son menores en un punto en 
cl caso del Cl Verbal, en 5 puntos para cl Cl de 
ejecuci6n y en 3 puntos para el Cl Total (Tulsky, 
Zhu y Ledbetter, 1997). En pocas palabras, 
el WAIS-III es una prueba mis diffcil que cl 
WAIS-R. Aquf se encuentra un enigma pertur- 
bador: £por qud la muestra normati va del WAIS- 
III parece ser mis inteligente que la muestra 
normati va del WAIS-R? Esta cucstidn se veri 
con mayor detalle en el Tcma 7B, Predisposi- 
ci6n de prueba y otras controversias. 

CONFIABILIDAD 

La confiabilidad del WAIS-III es excepcional- 
mente buena. El promedio dc las confiabilidadcs 
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mixtas de divisidn en mitades entre todos los 
grupos por cdad son: Cl Verbal, 0.97; Cl de 
Ejecucidn, 0.94; y Cl Total, 0.98. Los coefi- 
cientes de estabilidad en test-retest para 394 
examinandos confirman en mucho la misma 
imagen: Cl Verbal. 0.96; Cl de Ejecucidn, 0.91; y 
Cl Total, 0.96. Las confiabilidades y coeficien- 
tes de estabilidad para las cuatro puntuaciones 
Indice tiendcn a ser un tanto inferiores, pero 
aun se encuentran en o cerca de .90 en todos 
los casos. 

Para el Cl Total, el error estdndar de medi- 
da se cncuentra en el rango de 2 a 2.5 puntos, 
segun el grupo de edad. Considdrese lo que esto 
significa: 95% de las veces, el Cl Total verda- 
dero de una persona evaluada se encontrard 
dentro de ± 5 puntos (dos errores estdndar de 
medida) del valor obtenido. En tdrminos de uso 
cormin, los psicdmetras dirfan que el Cl del 
WAIS-II1 tiene una banda de error alrededor de 
10 puntos; es decir, las puntuaciones de Cl son 
precisas dentro de un rango de aproximadamcn- 
te ± 5 puntos. 

En contraste con las fuertes confiabilidades 
encontradas para las puntuaciones de Cl e fn- 
dice, las confiabilidades de las 14 subpruebas 
individuates son, en general, mucho mds ddbi- 
lcs. Las unicas subpruebas con coeficientes de 
estabilidad superiores a .90 son Informacidn 
(.94) y Vocabulario (.91). Para las subpruebas 
restantes, los valores de confiabilidad van des- 
de la parte baja del rango de .70 hasta me- 
diados del rango de .80. La implicacidn mds 
importante de estas conclusiones sobre confia¬ 
bilidad ddbil es que los examinadores deben 
abordar el andlisis de perfil de subpruebas con 
extremo cuidado. Las puntuaciones de subprueba 
que parecen tcner una elevaci6n (o disminuci6n) 
discrepante en cl caso de un individuo evalua- 
do podrfan ser consecuencia de la confiabilidad 
gencralmentc ddbil de ciertas subpruebas, mds 
que una indicacidn de fortalezas o dcbilidades 
cognitivas vcrdaderas. Algunos estudiosos del 
tema concluyen que el andlisis del perfil (la 
identificacidn de fortalezas y dcbilidades cogni¬ 
tivas espccfficas con base en el andlisis de los 
picos y valles en las puntuaciones de subprueba) 
no se justifica con fundamento en la evidcncia 
(Gregory, 1994b). 


VAUDEZ 

Con base en un numero de difcrentes lfneas de 
cvidencia revisadas aquf, la validez del WAIS- 
III parece ser bastante satisfactory. En numc- 
rosos estudios que correlacionan el WAIS-I11 
con pruebas establecidas de inteligencia y tam- 
bidn con medidas del rendimiento acaddmico, 
se ha demostrado su buena validez relacionada 
con el criterio. Por ejemplo, cl Cl Total del 
WAIS-III tiene una fuerte correlacidn con las 
puntuaciones globales en otras medidas: .93 con 
el WAIS-R, .88 con el WISC-III (en el caso de 
los jdvenes de 16 ados en los grupos donde se 
superponen las edades), .64 con Matrices Pro- 
gresivas Estandar y .88 con la Prueba de Intcli- 
gencia Stanford-Binel: Cuarta Edicidn. El Cl del 
WAIS-III tambidn tiene una fuerte correlacidn 
con las ocho subpruebas de la Prueba Wechslcr 
de Rendimiento Individual, al revelar una co- 
rrclacidn mediana de .70 (Tulsky, Zhu y 
Ledbetter, 1997). No existe duda de que el 
WAIS-R capta los mismos aspectos de la inte¬ 
ligencia global que miden otros instrumentos 
de amplia utilizacidn. 

La validez del WAIS-III tambidn se apun- 
tala en su fuerte supcrposicidn con el WAIS-R 
y con el WAIS original, para los cuales se ha 
establecido una impresionantc cantidad de da- 
tos de validez. Para una revisidn completa de 
estos datos, el lector debc consultar a Matarazzo 
(1972) y a Kaufman (1990). Aquf se presenta- 
rd un estudio representativo y provocativo en 
el que se realizd un andlisis de correlaciones 
del lugar acaddmico alcanzado por el alumno y 
las puntuaciones de prueba de inteligencia. 
Conry y Plant (1965) correlacionaron las pun¬ 
tuaciones del WAIS con la clasificacidn de 98 
estudiantes de educacidn media superior en el 
momento de su graduacidn. Tambidn correlacio¬ 
naron las puntuaciones del WAIS con el pro- 
medio de calificaciones al final del primer ano 
de universidad de 335 estudiantes de una se- 
gunda mucstra. Los resultados se presentan en 
el cuadro 6-2. Obsdrvese que el Cl Verbal pro- 
nostica el dxito acaddmico al mismo nivel que 
el Cl Total, mienlras el Cl de Ejecucidn con- 
serva una relacidn mds ddbil con los niveles de 
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Cuadro 6-2. Correlaciones entre el 
lugar academico en la secundaria, 
las calificaciones universitarias y las 
puntuaciones del WAIS 


Subpruebas 
del WAIS 
yCl 

Educacion media 
superior 
(N = 98) 

Unlversidad 
(A/=335) 

litformacion 

0.54 

0.48 

Comprensibn 

0.55 

0.33 

Aritmitica 

0.45 

0.19 

Semejanzas 

0.50 

0.39 

Retencibn de 

0.37 

0.04 

Dlgitos 

Vocabulario 

0.65 

0.46 

Slmbolos y 

0.34 

0.15 

Dlgitos 

Figures Incom- 

0.33 

0.20 

pletas 

Diseno con 

0.29 

0.19 

Cubos 

Ordenacibn de 

0.22 

0.07 

Dibujos 

Compostcibn 

0.17 

0.12 

de Objetos 

Cl Verbal 

0.63 

0.47 

Cl de Ejecudbn 

0.43 

0.24 

Cl Total 

0.62 

0.44 


Fu#nto: Adaptado con autohzacttn de Corny, R y Plant, W T. 
(1965) WAIS and group test predictions ol an academic success 
criterion. High School and cotege Educational and Psychological 
Measurement, 25,493-500 

rendimiento. Obsbrvese tambien que Vocabula- 
rio produce la correlaci6n general mis eievada 
de todo el cuadro (0.65) con la posicidn acadd- 
mica. Estos datos refuerzan en gran medida la 
inclusion de medidas de vocabulario en las prue- 
bas de inteligencia. 

Varios estudios refuerzan la validcz de 
consiructo del WAIS-III al mostrar que las 
puntuaciones de prueba en el caso de diversos 
grupos son consistentes con la teorfa. Por ejem- 
plo, Sattler (1982, 1988) ha sefialado que las 
lendencias relativas a la edad en las subpruebas 
del WAIS-R (las cuales son muy semejantes a 
las del WAIS-III) se conforman de manera es- 


trecha a la teorfa Cattell-Hom de la inteligencia 
fluida y cristalizada. El lector recordari del tema 
anterior que la inteligencia fluida se utiliza para 
resolver probiemas novedosos, mientras la in¬ 
teligencia cristalizada requiere la recuperacidn 
de respuestas aprendidas o habituates. Scgiin la 
teorfa, la inteligencia fluida dcclina de manera 
aguda en la vcjez, mientras la inteligencia cris¬ 
talizada permanece constante o aumenta ligcra- 
mente (Horn, 1985). 

Un anilisis del WAIS-R y del WAIS-III 
indica que las subpruebas verbalcs dependen 
mucho mis de la inteligencia cristalizada (re- 
cuperacibn de respuestas aprendidas), mientras 
las subpruebas de ejecucidn requieren altos ni- 
veles de inteligencia fluida (solucidn de pro¬ 
biemas novedosos). De conformidad con las 
expectativas tedricas, una inspeccidn de los 
datos normativos revela que las puntuaciones 
naturales en las subpruebas verbales muestran 
una disminucidn minima a medida que se avan- 
za en edad, mientras las puntuaciones natura¬ 
les en las subpruebas de ejecucidn caen de 
manera vertiginosa en el caso de personas ma- 
yores (Wechsler, 1981, 1997). Por supucsto, 
estos datos son transversalcs y, por tanto, no 
constituyen una prueba definitiva de la decli- 
nacidn longitudinal. Sin embargo, los decre- 
mentos con la edad en las subpruebas de 
ejecuci6n son tan notables que ponen a prueba 
la creencia de atribuirlas a difcrcncias de 
cohorte u otros factores artificiales. Es mis pro¬ 
bable que una proporcidn significative de esta 
disminucidn sea un descenso verdadero rela- 
cionado con la edad que corrobora la teorfa 
Cattell-Hom de la inteligencia. 

Otra expectaliva consistcntc con la teorfa, 
que se conflrma con los datos empfricos, es una 
fuerte relacibn entre los logros educativos y las 
puntuaciones de Cl (Kaufman, 1990). Estas dos 
variables deberfan tener una fuerte correlaci6n 
con base en dos suposiciones: que la educa- 
ci6n eleva la inteligencia y que las personas mis 
inteligentes buscarin en general un nivel mis 
alto de educacidn. 

En apariencia, los anilisis de la relacidn 
entre las puntuaciones de Cl del WAIS-III y los 
logros educativos todavfa no se han terminado. 
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Sin embargo, la investigacidn con la edici6n 
anterior es relevante para esta cuestidn debido 
a la fuerte semejanza entre los dos instrumcn- 
tos. Matarazzo y Herman (1984) analizaron el 
total dc afios de escolaridad contra el Cl 
Verbal, el Cl dc Ejecucidn y el Cl Total de los 
1 880 individuos utilizados en la mucstra de 
estandarizacidn del WAIS-R. Al excluir a las 
personas jdvencs, con edades de 16 a 24 anos, 
muchos dc los cuaics todavfa no terminaban su 
educacidn, la correlacidn entre las afios de es¬ 
colaridad terminada y el Cl Total fue de 0.63 
para los 500 sujetos entre 25 y 44 afios de edad 
y de 0.62 para los 730 individuos entre 45 y 74 
afios. 

Estas conclusiones rcvelan una correlacidn 
muy fuerte entre el logro educativo y las pun- 
luaciones de Cl. Por ultimo, el Cl de Wechsler 
y los logros laborales tambidn tienen una fuer¬ 
te vincu!aci6n (Reynolds, Chastain, Kaufman 
y McLean, 1987), lo cual tambidn brinda un 
apoyo adicional a la validez del WAIS-1II como 
medida de la inteligencia general. 


I ESCALA WECHSLER DE 
INTELIGENCIA PARA EL NIVEL 
ESCOLAR-III 


El WISC se publied en 1949 como una exten- 
si6n descendente de la Wechsler-Bellevue ori¬ 
ginal. Aunque se le utilizd ampliamente en los 
siguientes dos decenios, los psiedmetras perci- 
bieron varies defectos en ella: ausencia de in¬ 
dividuos de raza no blanca en la muestra de 
cstandarizacidn, ambiglledades en la califica- 
cidn, reactivos inapropiados para nifios (p. ej., 
referenda a “cigarros puros") y ausencia de 
mujeres y afroestadounidcnscs en el contenido 
pictdrico de los reactivos. El WISC-R 
(Wechsler, 1974) y el WISC-III (Wechsler, 
1991) corrigicron cstos errores. 

El WISC-III consta de 10 subpruebas prin- 
ci pales y tres complementarias. Las subpruebas 
vcrbales y dc cjecucidn se aplican en orden al- 
temado: 


Subpruebas Verhalcs Subpruebas dcEjccucida 
Informacidn Figuras Incompletas 

Semejanzas Claves 

Aritmdica Ordenacidn de Dibujos 

Vbcabulario Disefio con Cubos 

Comprensidn Composicidn de Objetos 

Retencidn de Ofgitos Busqucda de Sfmbolos 
Laberintos 

Retencidn de Dfgitos, Busqucda de Sfmbolos y 
Laberintos son subpruebas complementarias 
que, por lo comun, no se incluyen en el cdlculo 
del Cl. Sin embargo, en general, estas subprue¬ 
bas se aplican debido a la informacidn diag- 
ndslica que proporcionan. En caso dc que sc 
interrumpa la aplicacidn de una subprueba y 
dsta se arruine o deba omitirsc debido a discapa- 
cidades especiales, se le puede sustituir con 
Retencidn de Dfgitos (en el caso de subpruebas 
verbales) o Laberintos (en las subpruebas de 
Ejecucidn). Busqucda de Sfmbolos sdlo pue¬ 
de utilizarse como sustituto de la subprueba de 
Claves. 

La estandarizacidn del WISC-III es excep- 
cionalmente buena, ya que se basd en 100 ni- 
nos y 100 nifias en cada nivcl de edad dc los 6 
afios y medio a los 16 anos y medio (N total = 
2 200). Estos casos se seleccionaron con cuida- 
do y se estratificaron con base en cl censo de 
EUA para 1988 con respecto a raza/origen dtni- 
co (blancos, afroestadounidenses, nativos esta- 
dounidenses, esquimales, aleutianos, asnlticos, 
nativos de las Islas del Pacffico y otros), regidn 
geogrdfica y educacidn de los padres. Aunque 
no fue una variable formal de estratificacidn, 
el tamafio de la comunidad para la muestra de 
estandarizacidn del WISC-III se asemeja mu- 
cho a los datos del censo. La mucstra de estan¬ 
darizacidn se obtuvo tanto de escuelas publicas 
como privadas e incluye a niiios en programas 
de educacidn especial. Un rasgo deseable de la 
muestra es que 7% de los nifios estaba dentro 
dc las categorfas de discapacidades para el 
aprendizaje, trastornos emocionales y discapaci¬ 
dades del habla/lenguaje, etc., y 5% de la muestra 
incluyd a niiios dentro de programas para indi¬ 
viduos talcntosos. La confiabilidad del WISC-IH 
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cs comparable a la del WAIS-R: las ires pun- 
tunciones de Cl (Verbal, de Ejecucidn y Total) 
fnuestran confiabilidades de divisidn en mita- 
des y lest-retest denlro del rango de .90; mien- 
iras las subpruebas individuates poseen 
coeficientcs de divisidn en mi lades un poco m3s 
bajos, que van de .69 (Composicidn de Obje- 
tos) a .87 (Vocabulario y Diseno con Cubos). 
Las confiabilidades test-retest ticnden a ser li- 
geramenie mfis bajas. 

La validcz del WISC-III dcpcnde, en par- 
ie, de su superposici6n con el WISC-R, para el 
cual se pucden citar doccnas de estudios de 
susientnci6n. No se desca abrumar con detalles 
exccsivos, de modo que se refiere al lector in- 
icresado a Saltier (1988) para una buena revi- 
si6n de los estudios anteriores. El Manual del 
WISC-III cita un impresionnnte conjunto de es¬ 
tudios de validez, que sc rcsumir&n aqul. Los estu¬ 
dios preliminarcs indican fuertes correlaciones 
con las puntuaciones del WISC-R (r = .90 para 
el CIV; .8 1 para el CIE y .89 para el CIT), fuer¬ 
tes correlaciones con las puntuaciones del 
WAIS-R en el caso de personas de 16 afios de 
edad (r = .90 para el CIV; .80 para el CIE y .86 
para el CIT) y correlaciones un poco mcnores, 
pero confirmatorias, con las puntuaciones del 
WPPSI-R en una muestra de nifios de 6 anos 
de edad. Estas correlaciones son casi tan al¬ 
ias como lo permitirian las confiabilidades de 
las esealas rcspectivas. Un dcscubrimiento 
interesante, que se analiza en el siguiente ca- 
pflulo. cs que los Cl del WISC-III son, en pro- 
medio, aproximadamcnie cinco puntos menores 
que los Cl del WISC-R (Vance, Maddux, Fuller 
yAwadh, 1996). 

El WISC-III tambidn muestra correlacio- 
ncs confirmatorias de la teorfa con numerosas 
pruebas cognitivas, de capacidad y de rendi- 
miento (Wechsler, 1991). Por ejcmplo, en un 
estudio con 27 nifios entre los 7 a 14 anos de 
edad a los que se les aplicaron tanto el WISC- 
III como las Differential Ability Scales (Esca- 
lus de Capacidad Diferencial, DAS; Elliott, 
1990), las puntuaciones del CIV del WISC-III 
sc correlacionaron en .87 con las puntuaciones 
de Capacidad Verbal del DAS, pero s6lo en .58 
eon las puntuaciones de Rnzonamiento no Ver¬ 


bal de esa misma prueba. Por el contrario, las 
puntuaciones del CIE del WISC-III se conela- 
cionaron en .78 con las puntuaciones de Razo- 
namiento no Verbal, perosdloen .31 con lasde 
Capacidad Verbal. El Manual cita correlacio¬ 
nes consistentes con la teorfa —apropiadamente 
altas para constructos similares, bajas para 
constructos diferentes— con la Otis-Lennon 
School Ability Test (Prueba de Capacidad Rs- 
colar Otis-Lennon), cl Test de Retencidn Vi¬ 
sual de Benton-Revisado, subpruebas de la 
Baterfa de Pruebas Neuropsicoldgicas Halstead- 
Rcitan y cl Wide Range Achievement Test- 
Revised (Prueba de Aprovechamiento de Amplio 
Rango-Revisada. Los estudios con giupos espe- 
ciales de nifios —talentosos, con retraso mental, 
discapacidad para el aprendizaje, hiperactivi- 
dad, trastomos de conducta, retraso en liabla/ 
lenguaje— tambidn proporcionan un fuerte 
apoyo para la validez del WISC-III. 

Los estudios analftico-factoriales de la 
muestra de estandarizacidn proporcionaron 
evidencia adicional de la utilidad del WISC-III 
en la evaluacidn diagndstica de nifios. Los re- 
sultados de numerosos aniilisis factoriales, 
incluyendo los andlisis separados para cuatro 
subgrupos segun la edad (de 6 a 7, 8 a 9, 11a 
13 y 14 a 16 afios de edad) constituycn una 
fuerte indicacidn de una soluci6n de cuatro 
factores. Los primeros dos factores son fami- 
liares en estudios previos de las Esealas 
Wechsler: 


Comprensidn Verbal 

Informacidn 

Scmcjanzas 

Vocabulario 

Comprensidn 


OrganiznchSn Perceptual 
Figuras Incompletas 
Ordenacidn de Dibujos 
Diseno con Cubos 
Composicidn de Objctos 


El tercer factor en el WISC-III es un tanto dife- 
rente del de su antecesor, y el cuarto factor es 
nuevo: 

Libertad de la Velocidad de Proccsa- 

Distractibllidad miento 

Aritmdtica Claves 

Rclencidn de Dfgitos Busqueda de Sfmbolos 






1 


232 • Evaluation psicologlca: Hlstoria, prlntiplos y apllcaclones (Capilulo 6) 


Una subprueba, Laberintos, revelb una asigna- 
ci6n inconsistente a los factores, con cargas 
ddbiles en Libertad dc la Distractibilidad para 
ninos dc 6 a 7 ados y ddbiles cn Organization 
Perceptual para nifios de ocho afios y mayores. 

La solucidn dc cuatro factores se prescnta 
tambidn en las otras muestras. incluyendo pa- 
cicntes psiquiilricos infanlilcs (Tupa, Wright y 
Fristad, 1997), ninos canadicnscs seleccionados 
de mancra alcatoria (Roid y Worrall, 1997) y 
ninos que reciben education especial (Konold, 
Kush y Canivez, 1997). En una nota discrepan- 
te, Riccio, Cohen, Hall y Ross (1997) encon- 
traron que los factores 3 y 4 no eran importantcs 
desde el punto de vista clfnico, es decir, mos- 
traban relacidn minima con mcdidas indepen- 
dientes de atencidn en una muestra de ninos 
con supucstos problemas de atenciOn. 

La solucidn de cuatro factores para el 
WISC-UI da la posibilidad del informe opcio- 
nal de Puntuaciones dc fndice —similarcs a las 
puntuacioncs de Cl— para cada uno de los cua¬ 
tro factores. Estas puntuaciones se basan en la 
media familiar dc 100 y desviacidn estdndar de 
15. Las Puntuaciones de fndice (fndice de Com- 
prcnsidn verbal, 1CV, fndice dc Libertad de la 
Distractibilidad, ILD, etc.) se derivan de la asig- 


nacidn de las subpruebas que se lista antes y 
sirven para complementar los Cl Verbal y d c 
Ejecucidn. Este andlisis factorial del WISC-UI 
cs particularmente util en la evaluacidn dc 
discapacidadcs para cl aprendizaje y trastornos 
relacionados. En particular, los ninos con disca- 
pacidad para el aprendizaje tienen la probabili. 
dad de obtener puntuacioncs bajas en el terccr 
factor, lo cual sugiere que la distraccidn puede 
subyacer a algunas formas de este trastomo 
(Farnham-Diggory, 1978; Kaufman, 1979; 
Smith, 1983). Parker y Atkinson (1994) pro- 
porcionan una fundamentacidn y mctodos 
especffitos para el cilculo preciso (por el con* 
trario de la mera estimacidn) de las puntuacio¬ 
nes factoriales del WISC-III. 


§j ESCALA DE INTELJGENCIA 
gSTANFORD-BINET: CUARTA 

Hedici6n 


Con una herencia que data de la escala Binet- 
Simon dc 1905, la S(anford-Binet:Cuarta Edi- 
ci6n (SB:CE) tiene el linaje mis antiguo, y 
quiza mis prestigioso, de cualquier prueba dc 


Cuadro 6-3. Hitos en el desarrollo de la Stanford-Blnet y sus pruebas antecesoras 


Ano 

Pruebas/Autores 

Comentarlo 

1905 

Binet y Simon 

Prueba simple de 30 reactivos 

1908 

Binet y Simon 

Introduccldn del conceplo de edad mental 

1911 

Binet y Simon 

Extension para induir a los adultos 

1916 

Stanford y Binet 
Terman y Merrill 

Introduction del concepto de Cl 

1937 

Stanford-Binet-2 

Terman y Merril 

Primera utilization de formas paralelas (1 y M) 

1960 

Stanford-Binet-3 

Terman y Merril 

UtiizaclOn de mOtodos modemos de anilisis de reactivos 

1972 

Stanford-Blnet-3 

Thorndike 

ReestandarizatiOn de la SB-3 con 2 100 personas 

1986 

Stanford-Binet-4 

Thorndike, Hagen 
y Sattier 

ReestructuradOn complete en 15 subpruebas 
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j nte |jgcncia individual. En el cuadro 6-3 se rc- 
5llin en algunos dc los hilos importantcs en el 
desarrollo dc la Stanford-Binet y sus predece- 
soras. La SB:CE incorpora las principals rcvi- 
siones en cuanto a fundamcntacidn tedrica y 
conlenido de las pruebas dc inteligencia. Aun- 
que se ban conservado muchos de los tipos de 
rcacti vos de las antcriores escalas Binet-Simon, 
la SB:CE es. en realidad, una nueva prueba que 
comparte s61o una modesta supcrposicion con 
sus anteccsorns. 

MODELO DE INTELIGENCIA DE LA SB:CE 

La mds importante de las alteracioncs de la 
SB:CE es un modclo jcrarquico de la inteli¬ 
gencia con multiples subprucbas. En ediciones 
anteriores, el examinador s61o obtcnfa una 
puntuacidn mixta de CL Aunque podfa anali- 
zarse de manera cualitativa el patrdn de respues- 
tas correctas e incorrectas, las pruebas anterio- 
rcs no proporcionaban una base para el andlisis 
cuantitativo de los subcomponentes de toda la 
cscala. Esta deficiencia se corrige en la SB:CE, 
que estd formada por 15 subpruebas discnadas 
para evaluar la capacidad en cuatro areas: ver¬ 


bal, abstracta/visual, cuantitativa y de memoria 
a largo plazo. Dcbido a que las diferentes 
subpruebas son adecuadas para distintas eda- 
des, a un individuo s6lo se le aplican de 8 a 10 
subpruebas. Por tanto, la SB:CE produce hasta 
10 puntuaciones dc subprueba, cuatro puntua- 
ciones de area y una puntuacidn mixta (que ya 
no se denomina Cl) basada en toda la prueba. 

Los autores dc la SB:CEadoptaron un mo- 
delo jerdrquico de tres niveles dc la estructura 
de las capacidades cognitivas como una gufa 
para la constmccidn de esta prueba (figura 6-7). 
El primer nivel es el de capacidad general g, 
que los autores definen como “la unidad cog- 
nitiva y los procesos dc control que un indivi¬ 
duo utiliza en la organizacidn de estrategias 
adaptativas para la solucidn de problcmas nue- 
vos" (Thorndike, Hagen y Saltier, 1986). To- 
mando una extensa mucstra de un amplio rango 
de tareas cognitivas, los factores cspecfficos de 
cualquier subprueba particular disminuyen en 
importancia y la posicidn de la persona exami- 
nada en cl desempeno combinado sc vuclvc un 
reflcjo indirccto del factor de inteligencia g. 

El segundo nivel parece reconocer una 
aceptacidn de la perspcctiva modificada de 
Cattcll-Hom acerca de la inteligencia (p. ej.. 



Comprensadn 

Absurdos 

Relaoones Vorbales 


Series de ndmeios 


Copiado 


ConstrucckJn de ecuaclooes Matrices 


Memoria de trases 
Memoria de dlgitos 


Ooblado y cortado de papel Memoria de obtetos 


Figura 6-7. Factores de Capacidades Cognitivas y Subpruebas de la Stanford-Binet: Cuarta Edlcldn. 
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Horn y Cattcll, 1966) por parte de los autores 
de la SB:CE. Sin embargo, adcmAs de la dis- 
lincidn entre inteligencia cristalizada/fluida pro- 
puesta por Cattell y Horn, los autores han 
anadido un factor independiente de memoria a 
corto plazo que se basa en cuatro subpruebas. 
La SB:CE enfatiza las habilidadcs de memoria 
a un grado mucho mayor que cualquier otra 
prueba de inteligencia general. Cuando cl exa- 
minador dcsea una evaluacidn amplia de la me¬ 
moria a corto plazo, la SB:CE puede muy bien 
ser el instrumento de eleccidn. El factor de capa- 
cidades cristalizadas representa las habilidades 
relacionadas con la escuela, como cl vocabula- 
rio y las habilidades cuantitativas. El factor de 
las capacidades fluidas-analfticas es, en gran 
medida, un sindnimo del constructo dc Cattell- 
Hom accrca dc la inteligencia fluida y tipifica 
las habilidadcs cognitivas necesarias para re¬ 
solver problemas nuevos que conticnen cstfmu- 
los no verbales y Figurativos. 

El tercer nivel aiane en realidad sdlo al fac¬ 
tor de las capacidades cristalizadas, que los 
autores de la SB:CE dividen en dos Areas: razo- 
namiento verbal y razonamiento cuantitativo. 
A este nivel, las capacidades fluidas-analfticas 
recibcn la etiqueta altemativa de razonamiento 
abstracto/visual. Los autores sehalan que estos 
factores son mas especfficos y mAs dependicn- 
tes del contenido que los factores en el primero 
y segundo nivclcs. feslos se incluyen cn el mode- 
lo debido a que tienen un significado especial 
para clfnicos y educadores (Thorndike, Hagen 
y Sattler, 1986). En resumen, el examinador 
obtiene hasta 10 puntuaciones de subprueba, 
cuatro puntuaciones de Area (Razonamiento 
verbal, Razonamiento cuantitativo, Razona¬ 
miento abstracto/visual y Memoria a corto pla¬ 
zo) y una puntuacidn mixta total. 

SUBPRUEBAS DE LA SB:CE 

La ultima edicidn de la Stanford-Binet incluye 
IS subpruebas, pero no todas se aplican a to- 
dos los grupos por edad. Por ejemplo, Relacio- 
nes Verbales y Construccidn de Ecuaciones son 
demasiado diffeiles para ninos pequenos y, por 


lo comun, se aplican a personas de ocho affos 
en adelante. En contraste, Absurdos y Copiado 
son demasiado fAciles para personas mayo- 
res y, por lo comiin, se aplican sdlo a indj. 
viduos mcnores dc 10 ados de edad. Seis 
subpruebas abarcan todos los grupos por edad: 
Vocabulario, Comprensidn, Cuantificacidn, 
AnAlisis de Patrones, Memoria de Cuentas y 
Memoria dc Oracioncs. 

Nuevc de las subpruebas de la SB:CE se 
basan en los tipos de reacti vos que apareccn en 
ediciones anteriores. Sin embargo, por primeri 
vez los reaclivos similares se agrupan cn sub¬ 
pruebas. En ediciones previas dc la Stanford- 
Binet, los reaclivos sc ngrupaban por nivel de 
edad y no por contenido. Seis de las subpruebas 
de la SB:CE son nuevas y ayudan a corregirel 
fuerte dnfasis verbal de las versioncs antcrio- 
res. Las nuevas subpruebas proporcionan una 
cobertura mAs representati va dc las tarcas cuan¬ 
titativas, espaciales y de memoria a corto pla¬ 
zo. Las subpruebas de la SB:CE se describcn 
cn el cuadro 6-4. 

ESTANDARIZACION DE LA SB:CE 
Y PROPIEDADES PSICOMETRICAS 

La muestra de estandarizacidn se aplic6 a 5 013 
individuos con edadcs de 2 a 24 aftos. Sc utili- 
zaron los datos del ccnso de EUA para 1980 
con el fin de dcrivar la rcpresentacidn propor- 
cional en cinco variables: regidn geogrAftca, 
tamano dc la comunidad, grupo etnico, edad y 
sexo. Tambidn se obtuvieron datos sobre clase 
social. Debido a que habfa un exceso dc ninos 
cuyos padres provenfan de categorfas socio- 
ccondmicas altas (43% de la muestra contra 
19% dc la poblacidn), se utilizaron procedi- 
mientos de ponderacidn para cquilibrar los 
datos de estandarizacidn. Los ninos con ante- 
cedcntes socioecon6micos mAs altos se conta- 
ron como sdlo una fraccidn de un caso (tan poco 
como 0.28 para algunos grupos por edad) a fin 
de ajustar el exceso de individuos de las cate¬ 
gorfas socioecondmicas altas dentro de la mues¬ 
tra. £stc cs un procedimicnto estadfstico 
razonable y reconocido que mejora los datos 
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Cuadro &-*. Descripcidn de las subpruebas de la Stantord-Binet: Cuarta Edicidn 


Razonamiento verbal 

yiocabulario: Comienza con 14 reactivos pictbricos de vocabulario en los que la tarea del niflo pequeno 
consists en identificar el objelo representado en el dibujo; continua con 32 palabras que el sujeto debe delinlr. 
L as palabras diffciles de vocabulario son similares a: 

renuente teratogbnico pusilbnime 

Comprenslbn: Reactivos senclllos incluyen la identificacibn de paries del cuerpo humano, mientras que los 
dlllclles requieren juido sodal, razonamiento y evaluacibn. Un ejempio de un readivo dilfcil es: ‘iCuAles son 
algunas do las razones por las que debe requerirse que un trabajador nuevo se una al sindicato de trabajadores 
qua represents a sus companeros?" 

Absurdos: Esla subprueba se extiende s6lo hasla los 9 aftos de edad y requiere que la persona examinada 
Idenlilique la incongruencia en las ilustraclones. Esla (area demanda percepcibn de los delalles, concentraclbn 
y comprenslbn social. Un readivo caracterlstico podrfa representar a una persona que daramente camina 
hac.a adelante en la arena, con huellas al frente de eila, pero sin nlnguna huolla detras. 

Relaciones verbales: A la persona examinada se le lee (y tamblbn puede ver) una Hsta de cuatro palabras, 
con instmcdones de expresar la semejanza entre las primeras Ires cosas, pero la diferenda con respecto a 
una cuarta. Esla subprueba requiere lormacibn de conceptos y razonamiento verbal. Ejemplo: “iEn qub se 
ddarencian una marsopa, un dellfn y una ballena de un tiburbn?" 


Razonamiento abstractoArisual 


AnAllsis de patrones: Los readivos (belles implican colocar formas recortadas en los huecos de un tablero 
de formas, mientras que los reactivos diddles demandan que la persona reproduzca disefios complejos por 
medio de cubos. Los reactivos diddles requieren organizacibn perceptual y visualizackin espaclal, mientras 
que los reactivos de tablero de (ormas requieren capaddades visomotoras y de manipulacibn. 

Copiado: En el caso de ntflos menores de 10 art os, el sujeto debe reproducir un modelo simple de cubos 
sdlklos (para Indhrlduos muy pequertos) o copiar un diserto con papel y Ibpiz. Esla subprueba requiere que la 
persona Integre los procesos perceptual y motor. 

Matrices: La tarea de la persona consists en seleccionar el objeto, diserto o letra que complete major la 
matriz. Esta subprueba requiere razonamiento perceptual y tiene luertes cargos en inteligencia fluida. 

Ooblado y cortado de papel: Es una prueba de opcibn multiple en la que la persona examinada debe identificar 
cbrr.o se verfa un trozo de papel que se ha doblado y cortado si se le desdoblara. Esta subprueba demanda 
visualizacibn, pensamiento espacial y atencibn a senates visuales. Doblado y cortado do papel contribuye de 
marwra sustancial al factor de Razonamiento no verbalA/isualizacibn. 


_ Razonamien to cuantitativo 

Cuantificaclbn: Las (areas en esta subprueba van desde el conteo simple hasta los conceptos y operaciones 
•ritmbticos mbs completos. Esta subprueba es similar a Aritmdlica en las escalas Wechsler, pero depends 
n»nos de la educacibn formal. Un ejemplo de un react!vo dificll es: “iCuAntas losotas de 10 cm por 10 cm se 
nscesitan para cubrir una seccibn de piso de 1 m por 1 m?' 

Series de numeros: La persona examinada debe llenar una secuencia numbrica con el siguiente numero 
^ico. Esla subprueba mide razonamiento Ibgico y requiere persistence, flexibilidad y un enfoque de ensayo- 
»nor para los problemas diffciles. Un ejemplo de un readivo dilfcil es: ‘iCuales son los numeros siguientes?' 
5 - 10, 9. 18. 17. 34, 33___ 
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Cuadro 6-4. Descripcldn de las subpruebas de la Stanford-Binet: Cuarta Ediclon 

(continuacldn) 


Construccldn de ecuaciones: El sujelo debe reordenar correctamente una ecuacibn aritmbtica desordenada 
Como en el caso de Series de numeros, esla subprueba demanda Ibgica. Ilexibllidad y persistence. Un ejemplo 
de un reactivo cfitfcil es: 1/4 4 6 10 - / ■ 

Memoria a corto plazo 

Mcmoria de cuentas: Utllizando cuatro formas de cuentas de tres diferentes colores (un total de 12 tipos da 
cuentas), la persona examinada debe reproducir un disefto en fotograffa colocando cuentas reales en una 
estaca. Sin embargo, el disefio estd a la vista sblo durante clnco segundos, de modo que la tarea debe 
llovarse a cabo de memoria. No tiene llmite de tiempo. 

Memoria de (rases: La persona debe repetir al pie de la letra (rases presentadas de manera oral. Esla 
subprueba liene fuertes cargas en Comprensibn verbal a edades do 2 a 7 art os, pero es una buena medida del 
factor de Memoria para sujetos mayores. Ejemplo de una frase diffcil es: "A medida que los profesores se 
hacen mbs viejos, en general les parece cada vez monos imporiante publicar muchos artfculos breves cada 
a bo". 

Memoria de dfgltos: Esta subprueba es esencialmente idbntica a Retencibn de Dfgitos de las pruebas Wechster 
Mide memoria audiliva a corto plazo y libertad de la distractibilidad. Incluye dfgitos en orden progresivo y 
dfgitos en orden inverso. 

Memoria de objetos: En esta subprueba, a la persona se le muestra una serie de ilustrackmes de objetos 
individuates a una frecuencia de una por segundo. Despubs de que se han presentado todas las tarjetas para un 
reactivo, el individuo debe elegir los objetos mostrados entre aqubllos presentados en una tarjeta que 
contiene de 5 a 13 elementos. Para obtener un credito completo, el sujeto debe sebalar a los objetos correctot 
en el mismo orden en que se le mostraron. Esta subprueba contribuye de manera sustancial al factor de 
Memoria en todos los niveles de edad. 


Nota: Estos reactivos se parecen a los de la Stanlord-Blnel. pero en realidad no se encuentran dentro de la prueba 


de estandarizacidn. En general, parece ser que 
los datos normativos para la SB:CE son bastan- 
tc representatives de la poblacibn bianco. 

Con excepcidn de Memoria de Objetos, la 
confiabilidad de las subpruebas de la SB:CE es 
buena, a juzgar por los coeficientes Kuder- 
Richardson de consistencia interna dentro de 
los rangos de .80 y .90 oblenidos con casi to- 
dos los grupos por edad. La confiabilidad de 
Memoria de objetos fue sdlo regular, con co¬ 
eficientes de consistencia interna que por lo 
general se encuentran en la parte baja del ran- 
go de .70. La confiabilidad de las puntuaciones 
de Area es sobresaliente, en especial cuando se 
utiliza un complemento fntegro de subpruebas 
para obtener una puntuacidn de drea (los coefi- 
cientes de consistencia interna se encuentran 
en la parte superior del rango de .90). La pun- 


tuacidn mixta es excepcionalmente confiable, 
con coeficientes KR-20 que van de .95, a la edad 
de dos ados, a .99 a edades de 18 a 23 ados. La 
confiabilidad test-retest se evalud en muestras 
de ninos de 5 y 8 ados de edad. Con un interva¬ 
le promedio de 16 semanas entre sesiones, las 
confiabilidades en el retest se colocaron dentro 
del rango de .90 para la puntuacidn mixta, mien- 
tras las puntuaciones de drea y de subprueba 
demostraron un patr6n mds variable. Porcjem- 
plo, muchas de las confiabilidades en el retest 
se colocaron en los rangos de .60 y .70, que cs 
demasiado bajo para la toma de decisiones acer- 
ca de los individuos. En pocos casos, las confia- 
bilidades de subprueba fueron extremadamenie 
bajas: .28 para Cuantificacidn, .46 para Copia- 
do y .51 para Razonamiento Cuantitativo, cn la 
muestra de ninos de ocho anos de edad, y .56 
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Ufa Mcmoria de Cucntas en el caso dc la mues¬ 
li de ninos de cinco afios. Los examinadores 
harfan bien en interpretar con precaucidn las 
puntuaciones en estas subpruebas. 

aplicacion y calificaci6n 
OE LA SB:CE 

LaSB:CE utiliza la primera subprueba, Voca- 
bulario. como una prueba directi va para el res- 
to del examen. El propdsito de una prueba 
directiva consiste en reducir al mtnimo el nu- 
mero total de reactivos aplicados al saltarse los 
reactivos fAciles de subprueba que, casi con 
absoluta seguridad, la persona examinada 
aprobaria de todas formas. Con base en la edad 
cronoldgica y la puntuacidn de Vocabulario, el 
examinador consulta un cuadro para determi- 
narel nivel de entrada para todas las subpruebas 
resumes. AdemAs, el examinador debe esta- 
blccer un nivel basal y uno superior para cada 
subprueba. En el caso de pruebas como la 
SB:CE en las que los reactivos de subprueba 
sccalifican de los mis fAcilcs a los mAs diffei- 
les, el nivel basal es el punto bajo en el cual 
casi con toda seguridad la persona respondent 
de manera correcta a todas las preguntas. El 
nivel basal se encuentra cuando se aprueban los 
cuatro reactivos en dos nivcles consccutivos. 
A veces, cl examinador debe dirigirse hacia 
abajo del nivel de entrada para encontrar el 
nivel basal. El nivel superior cs aquAl por enci- 
ma del cual casi con toda seguridad el indivi- 
duo fallarfa en todos los reactivos rcstantes. La 
prueba se descontinua en cl nivel superior, que 
se encuentra cuando la persona reprueba ya sea 
en 3 de los 4 o en los 4 reactivos completos en 
dos nivcles conseculivos. 

Cada reactivo se aprueba o reprueba dc 
acuerdo con normas muy especificas. Se pro- 
porcionan guias extensas de calificacidn para 
etneo subpmebas: Vocabulario, Comprcnsidn, 
Absurdos, Copiado y Rclaciones Verbales. Es- 
las subpmebas requieren respucstas “libres" (lo 
contrario de respuestas de opcidn multiple) y 
Poede neccsitarse cierta cantidad de juicio para la 
calificacidn de las respuestas poco convencio- 


nales. Los autores de la SB:CE no informan los 
cstimados de confiabilidad intercalificadorcs; sin 
embargo, con base en la experiencia con otras 
pmebas, cs poco frecuente que las difcrencias en- 
tre examinadores en la interprctacidn dc las 
pautas de calificacidn constituyan una fuente 
comun de error de medicidn (Gregory, 1999). 

VAUDEZ DE LA SB:CE 

La validez relacionada con el criterio de la SB:CE 
ha sido el tema de numerosas investigaciones 
que correlacionan las puntuaciones obtenidas 
en este instrumento con las puntuaciones de 
otras pmebas de inteligencia y aprovcchamicn- 
to. El Manual Tecnico es inusualmente fdrtil en 
este sentido, presenta una multitud de estudios 
que comparan o correlacionan las puntuacio¬ 
nes de la SB:CE con otras medidas. En general, 
este instrumento se correlaciona bastante bien 
con otras pmebas individuates de inteligencia. 
Lo que es mils, el patrdn de correlaciones entre 
las puntuaciones dc Area de la SB:CE y las 
subpuntuaciones de otras pmebas es, en gene¬ 
ral, confirmatorio —las subescalas similares 
muestran correlaciones mAs altas que aqucllas 
que son diferentes. Porejcmplo, el Cl Verbal de 
las escalas Wechslcr se correlaciona mejor con 
la puntuacidn de Comprensidn Verbal dc la 
SB:CE (una medida similar) que con la puntua- 
ci6n de Razonamiento Abstracto/Visual de la 
SB:CE (una medida diferente). 

Varios estudios han investigado la validez 
de constructodc laSB:CEcon andlisis factoria- 
les confirmatorios disenados para establccer si 
la prueba corresponde a la teorfa que gui6 su 
construccidn (Kline, 1989; Laurent, Swcrdlik 
y Ryburn, 1992; Kaplan y Alfonso, 1997; 
Thorndike, Hagen y Sattler, 1986). En general, 
los estudios prestan poco apoyo a la existencia 
dc los cuatro factorcs planteados en la cons- 
trucci6n de la pmeba (razonamiento verbal, ra¬ 
zonamiento cuantitativo, razonamiento abstracto/ 
visual y memoria a corto plazo). Por ejemplo, 
Kline (1989) concluyd que la solucidn de dos 
factores de Sattler (1988) funciona mejor para 
edades de 2 a 6 anos, mientras la solucidn de 
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trcs factorcs se adapta mejor a I os grupos de ma¬ 
yor cdad. Con base en una amplia resena de 
estudios de validez, Laurent, Swerdlik y Rybum 
(1992) tambiin concluyeron que la SB:CE es 
una prueba bifactorial para edades de 2 a 6 ados 
(verbal, no verbal) y una prueba trifactorial para 
edades de siete anos y mayores (verbal, no ver¬ 
bal. memoria). Sin embargo, Thorndike (1990) 
defiende el modelo original de cuatro factores. 
En parte, el debate se reduce a la eleccidn del 
anilisis factorial "corrccto” (McCallum, 1990). 

La SB:CE es, sin lugar a dudas, mejor que 
las ediciones anteriores de esta prueba. Uno de 
los principales cambios —el desglose del des- 
emperio general en puntuaciones de irea y 
subprueba— es una adicidn bienvenida y util 
al examen de la inteligencia; ademis, incorpo¬ 
ra una buena cantidad de reactivos muy ficiles 
en la mayor parte de las subescalas. En conse- 
cuencia, el examinador obtiene una imagen 
mucho mis precisa del funcionamiento de bajo 
nivel en nifios y adultos jdvenes.* Para la eva- 
luacidn del retraso mental o el dafio cerebral 
significativo, la SB:CE es superior a casi todos 
sus competidores, en especial aqudllos como el 
WAIS-R cuyo Cl Total “toca fondo” a mitad en 
las puntuaciones 50. Otra ventaja de la SB:CE 
es que cuatro subpruebas evaluan memoria a 
corto plazo. Cuando el problema de referenda 
implies memoria a corto plazo, es probable que 
la SB:CE sea el instrumento a elegir. 

Sin embargo, la SB:CE tiene varias defi- 
cicncias. El problema mis grave es la falta de 
uniformidad de las puntuaciones mixtas. Las 
puntuaciones mis altas y mis bajas posibles 
fluctuan de manera bastante notable a travis de 
los diversos grupos por edad. Por ejemplo, la 
puntuacidn mixta mis aha posible para las eda¬ 
des de 2 a 12 ahos es de 164, pero, despuds de 
esa edad, el nivel superior cae hasta 149. Otro 


* Como ha seftalado Saltier (1988), es posible que la 
SB:CE no rinda puntuaciones vilidas en el caso de 
individuos de bajo funcionamiento menorcs a cuatro 
afios de edad. El “piso" de la prueba parece ser 
artificialmcnte alto para personas muy jdvenes. Por 
ejemplo, un nifio de dos anos de edad que falle en 
responder a todas las preguntas jtodavfa podria obte- 
ncr una puntuacidn de 95! 


problema significativo es la falta de una baterlt 
comparable para todos los niveles de edad que 
cubre esta prueba. A los nifios no se les ap|j can 
las mismas subpruebas que a los individuos de 
mayor edad. Otro problema con la SB:CE es U 
confusidn accrca de su estructura factorial, 
^Cuintos factores existen, 2,3 o 4? Parece haber 
surgido un consenso de que los cuatro facto, 
res propuestos por Thorndike el al. (1986) no 
se sustentan en la evidencia y que la solution 
de dos factores describe el desempeno en prut 
ba de nifios en edad preescolar, mientras la so- 
lucidn de trcs factorcs funciona mejor en cl caso 
de nifios de siete anos en adelante (Laurent tt 
al., 1992). Otra preocupacidn es la posibilidad 
de comparacidn de los resultados de la SB:CE 
con otras pruebas de inteligencia. Prewett y 
Matavich (1994) encontraron que las puntua¬ 
ciones mixtas de prueba de la SB:CE eran, en 
promedio, siete puntos mis altas a las del Cl 
del WISC-1II en una muestra de nifios canali* 
zados. Peor aun, la puntuacidn de Razonamien- 
to Verbal de la SB:CE era 12 puntos mayor, en 
promedio, que el Cl Verbal del WISC-III. La 
enorme diferencia en puntuaciones verbales es 
perturbadora porque indica que las dos prue¬ 
bas darfan impresiones diagndsticas sumamente 
diferentes en casos individuales. Sin embargo, 
es poco claro si las puntuaciones de la SB:CE 
son demasiado altas o si las puntuaciones del 
WISC-III son demasiado bajas (o quizis cstin 
en juego ambos efectos). 


H PRUEBAS DETROIT DE APT1TUD 

PARA EL APRENDIZAJE-4 

Las Detroit Tests of Learning Aptitude-4 
(DTLA-4; Pruebas Detroit de Aplitud para el 
Aprendizaje; Hammill, 1999) es una revision 
reciente de un instrumento que se publied por 
primera vez en 1935. La prueba se aplica de 
manera individual y esti disenada para nifios 
cscolaies entre 6 y 17 anos de edad. La DTLA-4 
consiste en 10 subpruebas que forman la base 
para el cilculo de 16 puntuaciones mixtas (in- 
cluyendo inteligencia general, nivel 6ptimo) y 
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|4 dreas dc capacidad. Las subpruebas se en- 
cuentran, cn gran medida, dcniro de la tradi- 
cl dn Binet-Wcchsler, aunque existen algunas 
sorpresas, pus incluyc una medida de la capa- 
c idad narrati va dc Constnjccidn de historias (cua- 
dro 6—5). 

La puntuacidn mixta de Capacidad Mental 
General se forma con la combinacidn dc las 
puntuacions cstandar de las 10 subpruebas en 
la balcrfa. La puntuacidn mixta de Nivel 6pti- 
mo se basa cn las cuatro puntuaciones stdndar 
mas alias obtenidas por el indi viduo y sc consi¬ 
ders que rcpresenta cl dscmpeno de la perso¬ 
na bajo circunstancias dptimas. Cada una de 
las 14 puntuaciones restantcs de las combina- 
cioncs sc deriva de una mezcla de varias 
subpruebas que se considers que midcn un alri- 
buto comtin. Por cjemplo, las subpruebas que 
implican cl conocimiento de palabras y su utili- 


Cuadro 6-5. Descripcibn breve de las 
subpruebas de la DTLA-4 


Subprueba Tarea 


Palabras opuestas 

Secuencias de 
disenos 

Imllacion do oraciones 

Lottos tnvertidas 

Construcr.ion de 
historias 

Reproduccidn de 
disenos 

Intormacibn basica 

Ralactonos simbdllcas 


Secuencias de pala¬ 
bras 

Secuencias de 
historias 


Proporcionar anlonimos 
(palabras opuestas) 
Oiscriminar y recordar ma¬ 
terial gralico sin sentido 
Repetir oraciones presen- 
tadas de manera oral 
Memoria visual a corto pia- 
zo y atencion 
Crear una historia logica 
a partir de varias ilustra- 
ciones 

Copiar disonos do me¬ 
moria 

Conocimiento do inlorma- 
ci6n y hechos cotidianos 
Seleccionar entre una se- 
rie de disoftos la parte 
taltante de un disofio 
anterior 

Repetir una serie de pa- 
'abras sin relacibn en¬ 
tre s( 

Organizar matorial pict6- 
rico en secuencias sig- 
nificativas 


zacidn se combi nan para obtener la puntuacidn 
mixta Verbal, mientras las subpruebas que no 
implican leclura, escritura o habla comprenden 
la puntuaci6n mixta No Verbal. Varias dc las 
puntuaciones mixtas estdn disenadas para re- 
presentar los principales constructs dentro 
de las tcorfas actuates dc la inteligencia. Ade- 
mrts de las puntuaciones mixtas del Nivel Men¬ 
tal General y del Nivel 6ptimo, las 14 puntua- 


cions mixtas rstantes de la 
siguientes: 

DTLA-3 son las 

Verbal 

No verbal 

(Linguistics) 

Atenci6n 

Incrementada 

Atencidn 

Rcducida 

(de Atcncidn) 

Motriz 

Incrementada 

Motriz 

Reducida 

(Motora) 

Fluida 

Cristalizada 

(Horn y Cattcll) 

Simultdnea 

Sucsiva 

(Das) 

Asociativa 

Cognitiva 

(Jensen) 

Verbal 

Ejccucidn 

(Wechsler) 


Las 16 puntuaciones mixtas se basan en la me¬ 
dia de 100 y en la dsviacidn estdndar de 15 ya 
familiarcs. Las lOsubpruebas se normaron para 
una media de 10 y desviacidn estdndar dc 3. 

Las puntuaciones mixtas se disenaron para 
ofrecer evaluaciones contrastantes, de modo que 
una diferencia entre puntuaciones pueda ser de 
importancia diagnostica. Por ejemplo, un indi- 
viduo que obtienc una puntuacidn alta en apti- 
tud de Atencidn-Reducida pero baja en aptitud 
de Atcncidn-Incrementada (en cl dominio de 
atencidn), supuestamente sufre de dincultadcs 
para la rememoracidn inmediata, memoria a 
corto plazo o concentracidn cnfocada. 

La DTLA-4 se estandarizd con 1 350cstu- 
diantes cuyos antecedents eran muy semejan- 
ts a los datos del censo en cuanto a sexo, raza, 
residencia urbana/rurel, ingrso familiar, logros 
educativos de los padres y drea gcogrdfica. La 
confiabilidad de este instrument es similar a 
la de otras pruebas individuals de inteligen¬ 
cia. con coeficientes de consistency interna que 
por lo general superan a .80 en el caso de las 
subpruebas, y a .90 en el caso de las puntuacio¬ 
nes mixtas. Asimismo, los coeficientes test-retest 
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para las subpruebas y puntuaciones mixtas sc 
cncuenlran en los rangos de .80 y .90. La vali- 
dez relacionada con cl criterio sc establecid ade- 
cuadamenlc a trav^s dc estudios correlalivos 
con otros instrumentos establecidos, como cl 
WISC-lII, K-ABC y la Baterfa Woodcock- 
Johnson. 

Una preocupacidn con la DTLA-4 es quc 
la divisidn conceptual en puntuaciones mixtas 
no se sustcnta lo suficiente en la evidencia em- 
pfrica. Por ejemplo, aunque pucde ser cicrto quc 
la puntuacidn mixta Simultdnea mida los pro- 
cesos cognitivos simultaneos propuestos por 
Das, Kirby y Jarman (1979), cxiste poco apoyo 
empfrico para apuntalar csta afirmacidn. Otro 
problema con el instrumento es que jexisten mils 
puntuaciones mixtas que subpruebas! Es inevi¬ 
table que tales puntuaciones tcngan fucrtes 
intercorrelaciones, dado que cada subprueba 
ocurre dentro de varias puntuaciones mixtas. 
En resumcn, la DTLA-4 pucde utilizarse como 
una buena medida de la inteligencia general, 
pero el empleo de las puntuaciones mixtas con 
propdsitos de planificacidn psicoeducativa re- 
quiere estudios cmpfricos adicionales. Schmidt 
(1994) proporciona una amplia revisidn de la 
DTLA-3. 


■ TEST BREVE DE INTEUGENC1A 
DE KAUFMAN (K-BfT) 


Las pruebas de inteligencia analizadas antes y 
en el tema anterior son medidas excelentes de 
la capacidad intelectual, pero no dejan dc tcncr 
defectos. Un problema es el tiempo quc se re- 
quiere para aplicarlas. Las sesiones de prueba 
con las Escalas Wechsler, la Baterfa Kaufman 
de Evaluacidn para Ninos y la Stanford-Binet 
pueden durar una hora y no es poco comtin quc 
se utilicen dos horas si el nifio es inteligente y 
propenso a hablar demasiado. Una segunda 
desventaja de estas pruebas tan conocidas es la 
cantidad de entrenamicnto que sc requiere para 
aplicarlas. La aplicacidn adecuada de la mayo- 
rfa dc las pruebas individuates de inteligencia 
se basa en la suposicidn de que el examinador 



(ienc un tftulo a nivcl avanzado en psicologfa o 
cn un campo relacionado y que ha tenido am- 
plia experiencia bnjo supervisidn con los ins- 
trumentos en cuestidn. 

Alan Kaufman respondid a la necesidaddc 
una medida breve de inteligencia, con fines 
de deteccidn y de aplicacidn fdcil, al desarro- 
llar el Test Breve dc Inteligencia de Kaufman 
(K-BIT, Kaufman y Kaufman, 1990; Kaufmany 
Wang, 1992). El K-BIT consistc en una seccidn 
de Vocabulario y una de Matrices. La primers 
conticne dos partes: Vocabulario expresivo 
(nombrar dibujos) y Definiciones (proporcio- 
nar una palabra con base en una frase breve y 
cn ortograffa parcial). La prueba dc Matrices 
requiere resolver analogfas dc matrices de 2 x 
2 y 3 x 3 utilizando estfmulos abstractos. 

Las normas dc la K-BIT sc establecicron 
para personas entre 4 y 90 anos dc edad y se 
pucde aplicar en 15 a 30 minutos. En esta prue¬ 
ba se obtienen puntuaciones estdndar con me¬ 
dia de 100 y DE de 15 para Vocabulario, 
Matrices y la combinacidn de ambas, llamada 
Puntuacidn Mixta de Cl. A pesar dc la compa- 
rabilidad de estas dimensiones de calificacidn 
con pruebas de inteligencia muy conocidas, los 
autores de la K-BIT aclaran que su instrumento 
no tiene el propdsito dc sustituir a los enfoques 
tradicionalcs (p. ej., WPPSI-R, K-ABC, WISC-HI 
o SB:CE). La K-BIT es principalmente una 
piueba de deteccidn util para senalar la neccsidad 
de una evaluacidn mds amplia. La brevedad de 
este instrumento tambidn lo hace la opcidn na¬ 
tural para investigacidn sobre inteligencia. 

Los datos de confiabilidad para la K-BIT son 
excepcionalmcnte fucrtes. La confiabilidad de 
divisidn en mitades y los coeficientes test-retest 
para una variedad dc muestras se colocaron en 
el rango de .90 para Vocabulario, .80 y .90 para 
Matrices y .90 para la Puntuacidn Mixta de 
Cl. La muestra normativa de 2 022 personas 
estuvo dentro de 1 a 3 puntos porcentuales con 
respecto a las cifiras del censo de EUA para 1990 
en cuanto a gdnero, regidn geogrdfica, raza u 
origen dtnico y logros educativos de los padres 
(edades dc 4 a 19 ahos) o dc los individuos exa- 
minados (edades dc 20 ados en adelante). 

El Manual de la K-BIT presenta datos de 
validez sumamente fucrtes, con base en 20 es- 
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tudios dc correlacidn. Estos resuitados son si- 
Hiilares a un estudio reciente de la validez con- 
currente en el que sc compararon los resuitados 
de la K-BIT con las puntuaciones del WAIS-R de 
200 individuos canalizados a un centra dc 
evaluacidn neuropsicoldgica (Naugle, Chclunc 
y Tucker, 1993). La muestra dc pacienles in- 
cluyd a personas con trastomos convulsivos, 
lesioncs encefilicas, abuso dc sustancias, tras- 
tomo psiquiitrico, embolia, demencia y otros 
padecimientos neurologicos. La hetcrogencidad 
de la muestra de pacientes garantizd un amplio 
tango de capacidad funcional, un rasgo desea- 
ble en un estudio de validacidn. Aunque las pun¬ 
tuaciones de la K-BIT tendicron a ser 
oproximadamcntc cinco veces mis elevadas 
que los dalos obtenidos del WAIS-R, las corre- 
laciones entre estos dos instrumentos fueron 
muy altas y constituyeron una confirmacidn de 
la tcorfa. El Cl dc Vocabulario (K-BIT) y el Cl 
Verbal (WAIS-R) se correlacionaron en .83, el 
Cl de Matrices (K-BIT) y el Cl de Ejecuci6n 
(WAIS-R) sc correlacionaron en .77 y los Cl 
totales dc ambos instrumentos tuvieron una sor- 
prendente correlacidn de .88. En un estudio en 
el que se compararon las puntuaciones de la K- 


BIT y del WISC-III de 50 estudiantes canaliza¬ 
dos, Prewett (1995) tambidn informo fuertes 
correlaciones (r = .78 para las puntuaciones 
totales) y descubrid que las puntuaciones dc la 
K-BIT tendfan a ser cinco veces mayores que 
sus cquivalcntes en el WISC-III. Canivez 
(1995) encontrd puntuaciones comparables en¬ 
tre la K-BIT y cl WISC-III para 137 nifios dc 
educacidn primaria y media y tambidn informd 
correlaciones muy fuertes entre las dos prue¬ 
bas, cn especial para las puntuaciones totales 
(r = .87). Eisenstein y Engelhart (1997) en- 
contraron que la K-BIT tenfa un buen desem- 
pefio en cuanto a cstimar los Cl de adultos 
canalizados por trastornos neuropsicoldgicos, 
pero Donders (1995) recomienda prccaucidn 
cuando se utilice la prueba con nifios que su- 
fren lesidn cerebral. La razdn es que las pun¬ 
tuaciones de la K-BIT muestran una relacidn 
insignificante con la duracidn del coma, es de- 
cir, la prueba no es un buen fndicc del estado 
neuropsicoldgico dc los nifios. Aun asf, la K-BIT 
es una medida sobresaliente de detcccidn de la 
intcligencia general para utilizarse en investiga- 
cidn o cuando las restriccioncs de liempo impi- 
den el uso de una medida mis larga. 


SSresumen 


1. Para propdsitos de la estimacidn de la inte- 
ligencia general, cualquier instrumento re- 
conocido, que tenga buenas normas, seri 
suficicnte. Sin embargo, cuando el propd- 
sito es la evaluacidn individualizada, los 
cxaminadorcs necesitan considerar las for- 
talezas y debilidadcs particulares de los ins¬ 
trumentos potencialcs. 

2. David Wechsler fue un investigador prag- 
mitico que se apropid en gran medida de 
las pruebas Army Alfa y Army Beta para 
disefiar muchas de las subpruebas dc las di- 
versas escalas Wechsler. Para cada una de 
sus pruebas de inteligcncia, Wechsler utili¬ 
ze de 10 a 13 subpruebas, donde aproxi- 
madamente una mitad son verbales y la otra 
mitad son de ejecucidn. 


3. La primera prueba de este autor fue la 
Wechsler-Believue, publicada en 1939 y ac- 
tualizada en 1946. Otras pruebas y sus fe- 
chas de revisidn son: Escala Wechsler de 
inteligcncia para los niveles precscolar y 
primario-Revisada (1967, 1989), Escala 
Wechsler de Inteligencia para el nivel es- 
colar-III (1949, 1974, 1991) y Escala 
Wechsler dc inteligehcia para adultos-III 
(1955, 1981, 1997). 

4. Todas las escalas Wechsler utilizan el mis- 
mo formato: de 10 a 13 subpruebas dividi- 
das casi por igual entre el dnfasis verbal y 
el dnfasis cn la cjccucidn; una mdtrica co- 
mun para el Cl, con media de 100 y desvia- 
cidn estandar de 15; un conjunto comun de 
subpruebas, de modo que los examinadores 
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puedan transferir con facilidad sus habili- 
dadcs de aplicacidn de la prueba dc una cs- 
cala Wechsler a otra. 

5. La Escala Wechsler de inteligcncia para 
adultos-III (WAIS-III) es la prueba indivi¬ 
dual mis usada para la inteligencia adulta; 
tiene excclente confiabilidad, una validez 
bien establecida y agrega una nueva sub- 
prueba: Matrices. 

6. Los anilisis factoriales de la Escala Wechsler 
de inteligencia para el nivel cscolar-III 
(WISC-III, entre 6 y 16 afios y medio dc 
edad) producen con frccuencia una solucidn 
de cuatro factores: Comprensidn Verbal 
(principalmente las subpruebas vcrbalcs), 
Organizacidn Perceptual (principalmente 
subpruebas dc cjecucidn), Libertad de la 
Distractibilidad (Aritm&ica y Retencidn de 
dfgitos) y Velocidad de Procesamiento (Cla¬ 
ves y Busqucda de S(mbolos). 

7. La prueba Stanford-Binet: Cuarta Edicidn 
(SB:CE) adopta un modelo jerirquico de 
la inteligencia. El factor general se cstima 
a travls de la puntuacidn total. Los subcom- 
ponentes del factor general incluycn un factor 
de capacidades cristalizadas (razonamicn- 
to verbal y razonamiento cuantitativo), un 
factor de capacidades fluidas-analfticas y 
un factor de memoria a corto plazo. 

8. La SB:CE consta de IS subpruebas, pero 
no todas se aplican a lodos los grupos por 
edad. La estandarizacidn de la prueba fue 


excclente. La SB:CE se correlaciona en gran 
medida con otras pruebas individuates de 
inteligencia. Sin embargo, los anAlisis 
factoriales confirmatorios de la SB:CE no 
siempre sustentan cl modelo de cuatro fac¬ 
tores de la prueba. 

9. La SB:CE contiene gran canlidad de reac- 
tivos ficiles y, por tanto, es especialmente 
util en la cvaluacidn del retraso mental. Un 
problema con la SB:CE es la falta de uni- 
formidad de las puntuaciones mixtas, que 
fluctuan de manera amplia entre los grupos 
por edad. Otro problema es la falta dc una 
baterfa comparable para todos los niveles 
de edad que cubre esta prueba. 

10. Detroit Tests of Learning Aptitude-4 
(DTLA-4) estd formada por 10 subpruebas 
que componcn la base para el cilculo de 16 
combinaciones. La DTLA-4 es una buena 
medida de la inteligencia general, pero q] 
desglose conceptual en 14 dreas dc capaci- 
dad neccsita sustentacidn cmpfrica. 

11. El Test Breve dc Inteligencia dc Kaufman 
(K-BIT) es una prueba de detcccidn de la 
capacidad intelectual que tiene normas 
adecuadas y que consiste en Vocabulario y 
Matrices. Aunquc el K-BIT produce un Cl 
mayor en aproximadamente cinco puntos 
al obtenido con el WAIS-R, la correla- 
ci6n tan elevada entre ambos instrumentos 
(r = .88) constituye un fuertc apoyo para la 
validez dela K-BIT. 



TERMINOS Y CONCERTOS CLAVE 


Constancia de Cl 
Comprcnsidn verbal 
Organizacidn perceptual 


p. 216 Libertad dela distractibilidad 
p. 231 Velocidad dc procesamiento 

p. 231 


p. 231 
p. 231 






Tema 6B 

Pruebas grupales de inteligencia 


Orlgenes y caracterlslicas de las pruebas grupales 
Bateria Multidimensional de Aptitud (MAB) 

Escala del Shipley Institute of Living (SILS) 

Bateria multinrvel: Prueba de Capacidades Cognitivas (CogAt) 
Prueba de Inteligencia Culturalmente Justa (CFIT) 

Matrices Progresivas de Raven (RPM) 

Perspectiva sobre las pruebas culturalmente justas 
Resumen 

Tdrminos y conceptos clave 

EisnananannBHnBMi 



CJna prueba grupal de inteligencia per- 
mite evaluar de manera rdpida y eficientc a do- 
cenas o cientos de personas al mismo ticmpo. 
En estc tema se presenta al lector una muestra 
de pruebas grupales destacadas. Para bien o para 
mal, el numero de pruebas grupales que se 
comercializan en la actualidad cs simplemen- 
te sorprendente —se cncuentran disponibles 
veintenas de cllas. En Ios numeros recientcs del 
Mental Measurements Yearbook (Mitchell, 1985; 


Conoley y Kramer, 1989, 1992) y de la serie de 
Test Critiques (Keyser y Sweetland, 1984-1988) 
se presentan varias docenas dc registros, ade- 
mds de que cada afio se publican instrumentos 
nuevos. La cobertura amplia de estc campo en 
crecimiento es simplcmcntc imposible. En con- 
secuencia, aquf la informacidn se centra en las 
interrogantcs surgidas de las pruebas grupales 
y despuds se revisard un muestrario ecldctico 
de estos diversos instrumentos. 
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I ORIGENES Y CARACTERIST1CAS 
DE LAS PRUEBAS GRUPALES 


ORIGENES DE LAS PRUEBAS GRUPALES 

Las primcras pruebas grupales de inteligencia 
que tuvieron alguna utilidad sc desarrollaron a 
principios del siglo XX cn EUA; sin embaigo, 
sus orfgcnes pucdcn ubicarsc en los csfucrzos 
de los psicdlogos curopeos del siglo XIX. La 
prueba grupal de inteligencia actual tiene una 
deuda, en especial con las tdcnicas de llenado de 
espacios en bianco quc desarrolld Ebbinghaus 
(1896). en el decenio de 1890. Su prueba con- 
sistfa en varios pasajes de un texto donde se 
omiu'an palabras o partes de ellas, como en el 
siguiente ejemplo breve: 

Caperucita Roja 

_una vez una pequefia y dulce_, 

amada por todos_que_sus ojos en 

ella. Su abue_le regal6 una caperuza de 

seda_, que llevaba_el tiempo. Le lla- 

maban_Roja. Un_, su madrc le 

dijo: “Tu _estd enferma y ddbil. 

_le este pastel y vino. No te saigas del 

_y no_con desconocidos.” 

La tarea del estudiante consistfa en llenar el 
mayor numero de espacios en bianco que fuera 
posible (en varias selecciones), con un lfmite de 
tiempo de cinco minutos; por lo comun, una sola 
persona aplicaba la tarea de llenado a un grupo 
completo. Sdlo en cuatro ocasiones, en varios 
miles de casos, un estudiante Ileg6 a llenar to- 
dos los espacios en bianco. Ebbinghaus emplca- 
ba el numero total de respuestas correctas como 
una base para comparer a los individuos en cuan- 
to a su capacidad intelectual (DuBois, 1970). 

Aiios despuds, el dxito prdctico de las es- 
calas Binet inspird a los psicdlogos para desa- 
rrollar pruebas de inteligencia que pudieran 
aplicar,se de manera simultdnea a grandes nu- 
meros de personas. En el capitulo anterior se 
ha senalado quc la necesidad de someter a prue¬ 
ba a miles de reclutas del ejdrcito para la pri- 


mera Guerra Mundial inspird a los psicdlogos cn 
EUA (bajo la conduccidn de Robert M. Yerkes) 
a lograr rapidos avances en la psicometrfa y e| 
desarrollo de pruebas. Ocurrieron adelnntos 
paralelos en los sistemas escolares, donde los 
administradores deseaban tencr medios efica- 
ces para examinar y asignar a los alumnos. Sin 
embargo, la tdcnica de llenado de espacios cn 
bianco y las preguntas abiertas limitaban gra- 
vemente la edcacia de la evaluacidn. Las prue¬ 
bas grupales evolucionaron rapidamentc a su 
diseno modemo: el formato de opcidn multiple. 

DIFERENCIAS ENTRE LAS PRUEBAS 
GRUPALES E INDMDUALES 

Las pruebas grupales difieren de las individua- 
lcs en cinco aspcctos: 

• Formato de opcidn multiple contra formato 
de preguntas abiertas. 

• Calificacidn mecdnica objetiva contra califi- 
cacidn por parte del examinador. 

• Aplicacidn grupal contra individualizada. 

• Empleo con Fines de detcccidn contra empleo 
dirigido a la planificacidn de regularizacidn. 

• Muestras enormes de estandarizacidn contra 
muestras simplemente grandes. 

Se analizard cada uno de estos conceptos por 
separado. 

La difcrcncia mds obvia cs que las pruebas 
grupales suelen emplear un formato de opci6n 
multiple. Aunque las primeras pruebas de este 
tipo utilizaban preguntas abiertas, esta caracte- 
rlstica se dejd de lado rdpidamente debido a las 
cantidadcs excesivas de tiempo que se requerfan 
para la calificacidn. Como un resultado del for¬ 
mato de opcidn multiple, las pruebas grupales 
pueden calificarse de manera rdpida y objetiva 
a travds de un instrumento de rastreo dptico 
conectado a una computadora. La calificacidn 
por computadora elimina los errorcs del exami¬ 
nador y los cfectos de halo que pueden ocurrlr 
cn la calificacidn de pruebas individuales. Ade- 
mds, los psiedmetras obtienen un acceso cast 
instantdneo al andlisis de reactivos y a los ban- 
cos de datos de prueba, de modo quc la califi- 
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eacitfn por computatlora promueve el rdpido 
dcsarrollo y revision de las pruebas grupales. 

£stas lambidn difieren de las pruebas indi¬ 
viduates en el modo de aplicacidn. En una prueba 
gropal, el examinador se limita, en gran medida, 
„ |a lectura dc instrucciones y a la imposicidn 
de I unites de tiempo; existen fnfimas oportuni- 
dades de interaccidn personal entre quien apli- 
ca la prueba y quien la toma. Para la mayorfa 
de los individuos examinados esto no tendrd 
importance, pero para algunos —los tfmidos, 
aqucllos que se confunden, quienes carecen dc 
motivacidn— la auscncia de rapport con el 
examinador tendrd resultados desastrosos. 

Las pruebas tradicionalcs dc inteligcncia 
sobresalen como auxiliares en el diagndstico y 
iratamicnto de las dificultadcs dc aprendizaje 
de los individuos, mientras que las pruebas 
grupales se utilizan con mds frecucncia como 
mltodos masivos dc dcleccidn en apoyo a la 
toma de decisiones institucionales. Asf. las prue¬ 
bas grupales pueden utilizarse en los sistemas 
escolares para “scnalar" a los nifios que tienen 
necesidad de regularizacidn o enriquecimiento 
escolar; en entomos industriales, para identifi- 
car a los buenos candidatos para un trabajo cs- 
pecffico; o en los ambientes militares, para 
ayudar a seleccionar a los reclutas que tienen 
discapacidadcs mentales. 

En general, las pruebas grupales se estan- 
darizan en mucstras de enorme tamafio —cicn- 
tos de miles de personas en vez de s6lo unos 
cuantos cientos dc casos seleccionados dc ma- 
nera cuidadosa cuando sc trata de pruebas in¬ 
dividuates. Por supuesto, nunca debe darse por 
sentada la idoneidad dc una muestra de 
estandarizacidn. Independientemente de que se 
utilicen muestras dc cstandarizacidn de gran 
tamano para las pruebas grupales o m4s peque- 
nas para las pruebas individuates, es importan- 
te determinar cl grado en que la muestra es 
representativa de la poblacidn en su conjunto. 

VENTAJAS Y DESVENTAJAS DE LAS 
PRUEBAS GRUPALES 

Aunque los pioneros en psicologfa abrazaron 
con entusiasmo las pruebas grupales, tambidn 


reconocieron la naturaleza de esta cspecie de 
trato con el Diablo: los psicdlogos han vendido 
el alma del individuo examinado a cambio dc 
los beneficios de las pruebas masivas. Whipple 
(1910) resumid las ventajas de las pruebas 
grupales, pero tambten senate los pcligros po- 
tenciales: 

La mayor parts de las pruebas mentales puede 
apllcarse ya sea a Individuos o a grupos. Ambos 
mOtodos tienen venta|as y desventajas. El mdto- 
do de grupo tiene, por supuesto, el mdrito par¬ 
ticular de la economla de tiempo; una class de SO 
o 100 nirtos puede realizar una prueba en menos 
de una quincuagOsima o contesima parte del 
tiempo que requeriria la aplicaciOn de la mlsma 
prueba de modo individual. En ciertos estudlos 
comparativos; por ejomplo, sobre los etectos de 
unas vacaciones de una semana sobre la ef icien- 
cia mental de los escolares, se vuelve Imperati¬ 
ve que todos los individuos reallcen la prueba al 
mlsmo tiempo. Por otro lado, cast con toda se- 
guridad en todo grupo habrd quienes, por una 
razdn u otra, no pueden seguir las instrucciones 
o ejecutar la prueba al mAximo de su capacidad. 

O metodo individual permits que el examinador 
detecte estos casos y, en general, mediante el 
ejercicio de la supervision personal, puede 
obtenerse, como se senald antes, InformaclOn 
valiosa acerca de la actitud de las personas ha- 
cia la prueba. 

En suma, las pruebas grupales plantcan dos ries- 
gos interrelacionados: 1) algunos individuos 
examinados tcndrAn puntuaciones muy por 
debajo de su capacidad verdadera debido a 
problcmas motivacionales o dificultadcs para 
seguir instrucciones y 2) las puntuaciones in- 
vAlidas no se reconocertm como tales, teniendo 
consccuencias indcseables para estos individuos 
attpicos. En realidad, no existc una manera sim¬ 
ple en que puedan evitarse por completo estos 
riesgos, que son parte del intercambio en favor 
de la eficacia cuando se opta por las pruebas 
grupales. Sin embargo, es posible reducir al mf- 
nimo las consccuencias potencialmente negati- 
vas si los examinadores analizan con csccpti- 
cismo las puntuaciones muy bajas y recomien 
dan evaluacidn individual para estos casos. 

Volvemos ahora nuestra atcncidn hacia un 
an&lisis de varias de las pruebas grupales de in- 
teligencia mas destacadas. Se recuerda al lector 
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que, debido al gran numero de estos instrumcn- 
tos, por necesidad. la revisi6n serfi selecciona- 
da. Se presenta una revision equilibrada de 
instruments viejos, establecidos, y nuevos pro- 
metedorcs para cl campo, comenzando con una 
prucba quc intenta cerrar la brccha entre las pruc- 
bas individuates y grupales de inteligencia. 


I BATERfA MULTIDIMENSIONAL 
DE APTITUD (MAB) 


La Multidimensional Aptitude Battery, MAB 
(Batcrfa Multidimensional de Aptitud; Jackson, 
1984a) es una prueba grupal reciente para eva- 
luar inteligencia que se disend para ser un equi- 
valente de tepiz y papel del WAIS-R (Krieshok 
y Harrington, 1985). Como el lector recordard, 
el WAIS-R es un instrumcnto muy rcspctado 
(ahora recmplazado por el WAIS-III) quc sc 
utiliza ampliamcnte como prueba individual de 
la inteligencia adulta. Kaufman (1983) senala 
que el WAIS-R “es el criterio de la inteligencia 
adulta y ningun otro instrumento se le acerca”. 
Sin embargo, un profesional bien entrenado 
rcquicre cerca de una hora y media simplemente 
para aplicar la prueba de Wechsler para adultos 
a una sola persona. Debido a quc cl tiempo 
profesional es muy solicitado, una evaluacidn 
completa con la prueba de inteligencia Wechsler 
—que incluye aplicacidn, calificacidn y re- 
daccidn del informe— puedc costar cientos de 
ddlares. Desde hace tiempo, muchos examina- 
dores han sospechado que una prueba grupal 
apropiada —con las ventajas adicionales de la 
calificacidn objetiva y del informe narrativo por 
computadora— puede proporcionar una alter- 
nativa igualmente valida y mucho menos cos- 
tosa a las pruebas individuales, para la mayorfa, 
pero no para todas las personas. 


ANTECEDENTES Y DESCRIPa6N 

La MAB se disehd para producir subpruebas y 
factorcs paralclos a los del WAIS-R, pero con 
el empleo de un formato de opcidn multiple quc 
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puedc calificarse por computadora. El objetivo 
aparente en cl disefio dc csta prueba consists 
en producir un instrumento que pudiera ap|j. 
carse a docenas o cientos de personas con U 
presencia de un solo examinador (y quizd unos 
cuantos supervisores de examen) con el mini, 
mo entrenamiento. Ademds, la MAB se disefUS 
para obtener puntuaciones de Cl que tienen pro- 
piedades psicomdtricas similares a las encon- 
tradas en el WAIS-R. La MAB es apropiada 
para individuos dc 16 a 74 ados de edad y pro- 
porciona 10 puntuaciones dc subprueba, asf 
como Cl Verbal, de Ejecucidn y Total. 

Aunquc utiliza reactivos originates de prue¬ 
ba, la MAB es principalmente un cion elaborado 
del WAIS-R. iddntico en todas las subpruebas. 
Las 10 subpruebas de la MAB se muestran a 
continuacidn: 


Verbal 

Informacidn 

Comprensidn 

Aritmdtica 

Semejanzas 

Vocabulario 


Ejecucidn 
Sfmbolos y Dfgitos 
Figuras Incompletas 
Espacial 

Ordenaci6n de Dibujos 
Composicidn de Objetos 


El lector observard que en la MAB no se inclu¬ 
ye Rctcncidn dc Dfgitos del WAIS-R; la razdn 
es, en gran medida, de naturaleza prdctica: sim¬ 
plemente no habrfa manera de presentar una 
subprueba parecida en un formato de ldpiz y 
papel; en cualquier caso, la omisidn no es gra¬ 
ve. Retention de Dfgitos liene la corrclacidn 
mis baja con el Cl Total del WAIS-R, y es muy 
conocido quc csta subprueba contribuye poco 
a la medicidn de la inteligencia general. 

La unica diferencia significativa con res- 
pecto al WAIS-R es la sustitucidn de Disefio 
con Cubos por la subprueba Espacial en la 
MAB. En 6s ta, las personas deben ejecutar a 
nivcl mental rotacioncs espaciales dc figuras y 
seleccionar como respuesta una de cinco rota- 
ciones posibles presentadas (figura 6-8). Sdlo 
se utilizan rotacioncs mcntales (aunquc se in- 
cluyen versiones “invertidas" del estfmulo ori¬ 
ginal, como reactivos distractores), los reactivos 
avanzados son muy complejos y demandantes. 
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Figures Incomplolas: Elija la letra inlcial de la palabra quo describe la parte lallante en el dlbujo 



La respuesta os Faro, por tamo debe marcarse A 

Espacial: Ellja una flgura a la derecba de la llnea vertical quo sea la misma que la ligura a la Izquierda 
Una de las flguras se puede glrar para parecerse a la ligura a la Izquierda. las otras tendrfan que 
irrvertlrse 



La respuesta corrects es A, de modo que data debe marcarse Las otras 8CDE tendrian que 
Invertirse. 

Ensemble de Objotos: Ellja el orden. de izquierda a derecba, en que deben cotocarse estas partes 
para lormar el objeto. 



La respuesta corrects es C-132, de modo que se debe marcar C. Sdlo esle orden crearla 
el objeto laze 


Flgura 6-8. Reactivos de demostracten de tres pruebas de ejocuckSn de la MA8. 

Fuente: Reproducldo con autorlzacibn de Jackson 0. N. (1984a). Manual lor the Multidimensional Aptitude Battery. 
Port Huron Ml: Sigma Assessment Systems, Inc. (800) 265-1285. 


Los reactivos en cada una de las 10 sub- 
pruebas de la MAB estan distribuidos en orden 
de dificultad creciente; se comienza con pregun- 
las y problemas que la mayoria de los adoles- 
centes y adultos consideran sencillas y continua 


con reactivos que son tan diffciles que sdlo al- 
gunas personas los responden de manera co- 
rrecta. No se castigan las conjeturas y se alienta 
a los individuos examinados a responder a to- 
dos los reactivos dentro del limitc de tiempo. A 
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diferencia del WAIS-R (donde las subpruebas 
vcrbales son medidas de poder sin Kmite de tiem- 
po), todas las subpruebas de la MAB incorporan 
elementos tanto de poder como de velocidad: a 
los indi viduos s<5lo se les pcrmiten siete minutos 
para trabajar en cada subprueba. Incluyendo las 
instrucciones, las partes Verbal y de Ejecucidn 
de la MAB rcquieren, cada una, aproximada- 
mente 50 minutos para su aplicacidn. 

CARACTERISTICAS TUNICAS 

La primcra publicacidn de la MAB (Jackson, 
1984a) no se estandarizd de la manera tradicio- 
nal, donde las puntuacioncs se vinculan con el 
desempeno de muestras grandes y representa- 
tivas, estratificadas segun variables como sexo, 
raza, residencia urbana-rural, ocupacidn de los 
padres, regidn gcogrdfica y similarcs. En lugar 
de ello, los autores siguieron una estrategia de 
calibracidn de las puntuaciones de la MAB con el 
WAIS-R como prueba de referenda. Para derivar 
la fdrmula lineal de calibracidn, sc aplicaron tanto 
el WAIS-R como la MAB, en forma contrabalan- 
ceada, a una muestra de estudiantes universitarios 
(n = 18), estudiantes del ultimo ano de educa- 
ci6n media superior (n = 74), pacientes psiquiii- 
tricos hospital izados (n = 58) e individuos bajo 
libertad condicional (n = 10). Los examinados, 
117 varones y 43 mujeres, tenfan edades de los 16 
a los 35 anos. Los coeficientes de correlacidn 
cnlre los Cl de la MAB y del WAIS-R fueron de 
.82, .65 y .91 para los Cl Verbal, de Ejecuci6n 
y Total, respectivamente. De hecho, las tablas 
normalivas presentadas en el Manual reflejan 
una transformacidn lineal simple de las puntua¬ 
ciones naturales de la MAB a los Cl del WAIS-R 
para esta muestra inicial de 160 personas. 

El Manual presenta varios cstudios de 
confiabilidad de consistencia interna y test- 
retest ; en general, los resultados son bastante 
notables. Por ejemplo, en un estudio con mds 
de 500 adolescentes entre 16 y 20 anos de edad, 
la confiabilidad de consistencia interna de los 
Cl Verbal, de Ejecucidn y Total se eoloed en la 
parte superior del rango de .90. En un estudio 
test-retest con 52 pacientes psiquidlricos jdve- 


nes, las subpruebas individualcs mostraron 
confiabilidades que iban de .83 a .97 (mediana 
.90) para la escala Verbal, y de .87 a .94 (me¬ 
diana .91) para la escala de Ejecucidn. Estos 
resultados se comparan de manera bastante fa¬ 
vorable con los estdndarcs presentados para el 
WAIS-R (Wechslcr, 1981). 

Los andlisis factoriales de la MAB ofrecen 
un fuerte apoyo a la validez de constructo de 
este instrumento (Lee, Wallbrown y Blaha, 
1990; Wallbrown, Carmin y Barnett, 1988). 
En un andlisis factorial con las puntuaciones de 
3 121 varones y mujeres, estudiantes de bachi- 
llcrato, el Manual presenta un factor general con 
cargas de moderadas a altas para todas las .sub¬ 
pruebas (de .53 a .82). En un andlisis factorial 
independiente con los datos de los individuos 
de estandarizacidn. Lee, Wallbrown y Blaha 
(1990) encontraron dos factores ortogonales 
despuds del primer factor general. Estos dos 
factores rotados pueden identificarse con toda 
claridad como factores Verbal y de Ejecucidn. 
Ademds, otros investigadores han seftalado la 
congruencia extremadamente fuerte entre los 
andlisis factoriales del WAIS-R (sin Retencidn 
de Dfgitos) y de la MAB. En una muestra de gran 
tamano de intemos, Ahrens, Evans y Barnett 
(1990) observaron cambios confirmatorios de 
validez en las puntuaciones de la MAB en rclacidn 
con el nivel cducativo. Asf, existen buenas jus- 
tificaciones para utilizar las escalas indcpendicn- 
tes Verbal y de Ejecucidn en la MAB. 

En general, la validez de la MAB depende 
de su muy fuerte semejanza ffsica y empfrica 
con su prueba madre, el WAIS-R. Los datos 
correlativos entre las puntuacioncs de ambas 
son importantes en este senlido. Para 145 per¬ 
sonas heterogdneas a las que se les aplicaron la 
MAB y el WAIS-R en forma contrabalanceada. 
las correlaciones entre el las fueron de .44 (Es- 
pacial/Diseno con Cubos) a .89 (Aritmdtica y 
Vocabulario), con una mediana de .78. Las co- 
rrelacioncs entre los Cl del WAIS-R y MAB 
fueron muy saludables; es decir, .92 para el Cl 
Verbal, .79 para el Cl de Ejecucidn y .91 para 
el Cl Total (Jackson, 1984a). Sdlo con algunas 
excepciones, las correlaciones entre las pun¬ 
tuaciones de la MAB y del WAIS-R superan a 
aqudllas entre el WAIS y el WAIS-R. 
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COMENTARIO SOBRE LA MAB 

Jackson (1984a) tuvo gran cuidado cn el desa- 
jjollo de la MAB. mejorando dc manera continua 
el instmmento durante un periodo de aproxima- 
datnentc 10 ados antes de publicarlo. Durante 
este tiempo, los reactivos se seleccionaron, re- 
visaron y eliminaron conformc a criterios 
psicom&ricos rigurosos concemientes al nivel 
dc dificultad. poder discriminative y eficacia de 
las alternativas distractoras. No es dc sorpren- 
derque el instrumento resultante sea una haza- 
fla de excelencia psicomdtrica. Los Indices de 
confiabilidad son fuertes, los andlisis factoriales 
confirman la dicotomfa verbal/de ejecucidn y 
las puntuaciones de subpruebas y Cl generates 
sccorrelacionan excepcionalmcntc bien con las 
medidas correspondientes del WAIS-R. 

A pesar de ello, varios revisores han pre- 
sentado advertencias y preocupaciones acerca 
de la MAB que merecen comentario. Krieshok 
y Harrington (1985) scfialan que el Manual no 
proporciona estimados de legibilidad para las 
mstnicciones o para los reactivos en sf, sino que 
express vagamente que la MAB “presupone 
habilidades de lenguaje necesarias para leer 
y comprender instruccioncs por escrito y para 
comprcnder instrucciones vcrbales". Sin embar¬ 
go, no recomicnda un nivel mlnimo de lectura 
para la aplicacidn valida; esto puede conducir 
al examinador a suponer que cualquicr perso¬ 
na que Uega al ni vcl mini mo de edad de 16 ados 
puede tomar la MAB, una presuposicidn que 
evidentemente es poco firme. De hecho, Krieshok 
y Harrington (1985) sometieron a la MAB a un 
anilisis de legibilidad por computadora, y con- 
cluyeron que algunos reactivos verbales requie- 
ren un nivel de lectura del primer afio de 
educacidn media superior. Debido al nivel re- 
lativamente alto dc lectura que se necesita en 
partes de esta prueba, parece probable que un 
estudiante que en otros sentidos es muy inteli- 
gentc, pero que tiene discapacidad para la lee- 
font. podria tener una puntuacidn artificialmcnte 
baja en la MAB. 

La MAB ha demostrado ser una verdadera 
promesa en investigacidn, orientacidn vocacio- 
nal y seleccidn de personal; ademds, puede fun- 


cionar como instmmento de deteccidn cn entor- 
nos clfnicos, siempre y cuando el examinador 
considere las puntuaciones bajas como base 
para una prueba de seguimiento con cl WAIS-R. 
Los examinadores deben tener en mentc que la 
MAB es una pmeba grupal y que, por tanto, 
lleva consigo cl potcncial de mal uso en casos 
individualcs. La MAB no debe utilizarse de ma¬ 
nera aislada para la toma dc decisiones diagnos¬ 
tic's o para asignacidn a programas como 
clases para individuos intelectualmcntc dotados. 


^ ESCALA DEL SHIPLEY INSTITUTE 
OF LIVING SCALE (SILS) 

La Shipley Institute of Living Scale (SILS) tam- 
bidn se conoce como Shipley-Hartford, debido 
a que sc le instituyo hace ddcadas cn Hartford, 
Connecticut (Shipley, 1940, 1983). La SILS se 
propuso originalmcntc como (ndicc de detc- 
rioro intelcctual, en un intento por estimar los 
efectos de la demencia, dafto cerebral y otros 
padecimicntos organicos. Sin embargo, la pme¬ 
ba se ha empleado principalmente como una 
pmeba corta de detcccidn dc la inteligencia, cn 
especial dentro del sistema de salud mental de 
la Administracidn de Veteranos. 


ANTECEDENTES Y DESCRIPCION 

La SILS se conforma de dos subpruebas, vo- 
cabulario y abstraccioncs. La intcncidn original 
de la pmeba era de tec tar cl deterioro org&iico 
intelcctual al contrastarel desempeno en las sec- 
ciones de vocabulario y abstracciones. Se 
consideraba que el deterioro orgdnico tenia re- 
lativamentc poco efecto sobre el vocabulario, 
y que la capacidad de abstraccidn mostraria una 
disminucidn significativa. Por tanto, una gran 
discrepancy cn favor de vocabulario sobre abs¬ 
tracciones parecerfa significar la presencia de 
alteracidn organica. Sin embargo, numerosos 
estudios y revisiones concluyeron que la SILS 
tiene un desempefio deficientc como Indice del 
dafio orgdnico (p. ej., Yates, 1954; Johnson, 
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1987) por lo quc se utiliza pocas veces con 
estc propdsito. 

La SILS consiste cn 40 reactivos de opcidn 
multiple para vocabulario y 20 para pensamien- 
to abstracto; cada reactivo se califica como co- 
rrecto o incorrecto. Los reactivos abstractos 
cuentan doblc, de modo que la maxima pun- 
tuacidn en cada mitad de la prueba es de 40 
puntos. Tambidn se presents una punluacidn 
mixta. La prueba se autoaplica con un Ifmite de 
tiempo dc 10 minutos para cada una de las dos 
seccioncs. Algunos usuarios favorecen el uso 
de la prueba sin Ifmite de tiempo y se han cla- 
borado normas independientes para este enfo- 
que (Hcinemann, Harper, Friedman y Whitney, 
1985). Pocas personas necesitan mds de 10 
minutos por seccidn; la mayorfa de los exami- 
nadores consideran que la SILS puede ser com- 
pletamente una medida de poder. Tambidn cxiste 
una versidn de la prueba para microcompu- 
tadora; la computadora aplica y califica la 
prueba y produce un informe narrativo y una 
representacidn grdfica de las puntuacioncs. 

En la seccidn de vocabulario, la tarea de la 
persona examinada consiste en seleccionar el 
sindnimo de una palabra entre cuatro altemati- 
vas. Los 40 reactivos se parecen a los siguientes: 

• NAVE casa drbol tenedor barco 

• PUERIL gordo oportuno necio seco 

La puntuacidn dc vocabulario es el numero co- 
rrecto mds un punto por cada cuatro reactivos 
omitidos. Sumar los puntos para los reactivos omi- 
tidos proporciona una correccidn para la nega- 
tiva a adivinar. Como resultado de este factor 
de correccidn, la puntuacidn minima es aproxi- 
madamente de 10 entre 40 puntos. 

La intencidn era quc los reactivos de abs- 
traccidn deberfan requerir que la persona exa¬ 
minada obtuviera por inducci6n algun principio 
comun para una scrie dada de componentes y 
despuds demostrara su comprensidn de este 
principio terminando la serie. Cada reactivo es una 
serie de letras o numcros seguidos de espacios 
en bianco para indicar el numero de caracteres en 
la respuesta. Los 20 reactivos se pareccn a los 
siguientes: 


• A B D G K __ 

• nao pan arar sara 2 6 8 _ 

• 135 341 52 12_ 

La persona debe terminar cada serie y colocar |» 
respuesta apropiada en los espacios en bianco. 
(Las respuestas a los reactivos anteriores son P, 
962 y 3). For supuesto, para obtener la respuesta 
correcta, el individuo debe inferir la regia que 
determina la progresidn de los estfmulos en cada 
reactivo y despuds utilizar la regia para deter- 
minar la continuacidn. (En el reactivo 1, la dis- 
tancia entre letras aumenta aritmdticamentc; en 
el reactivo 2, los pares son imdgencs de espejo 
una de la otra, excepto por la ultima y la prime- 
ra letra que aumentan por uno —de o-p, r-s; en 
cl reactivo 3, cada grupo de numcros suma uno 
menos que el grupo anterior - 9, 8, 7,...). 

CARACTERISTICAS TECNICAS 

Zachary (1986) ha publicado normas recicntcs 
para la SILS con base cn 290 pacientes psiquid- 
tricos di versos que tambidn realizaron el WAIS. 
La muestra contiene numeros aproximadamente 
iguales de varones y mujeres; esta muestra nor- 
mativa es de jdvencs: la mayorfa se encucntran 
entre 16 y 54 ados, con una mediana dc edad 
de 30 ados. Con base en esta muestra, el ma¬ 
nual contiene tablas de puntuaciones T corre- 
gidas segun edad (media de 50, DE de 10) para 
vocabulario y abstracciones. Contra cl consejo 
dc numcrosos investigadores anteriores, el au- 
tor del Manual de la SILS tambidn introdujoel 
Cociente de Abstraccidn (CA), un nuevo fndi- 
ce de deterioro basado en la diferencia entre 
las puntuaciones de Vocabulario y Abstraccio¬ 
nes. El CA se obtiene al comparer la puntua- 
cidn pronosticada contra la puntuacidn obtenida 
en abstracciones. La puntuaci6n pronostica¬ 
da se obtiene de una ecuacidn de regresidn quc 
utiliza la puntuacidn de vocabulario, la edad ? 
el nivel educativo. El CA es una mejorfa sobre 
los fndices anteriores de deterioro en cuanto a 
que, para su cdlculo, se toman en cuenta to* 
disminucioncs quc ocurren de manera natural 
con la edad. Las personas con esquizofrenia)' 
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otros jndividuos con disminucibn en su eficien- 
cia intelectual ticndcn a obtener bajos CA. Sin 
embargo, existen causas no patolbgicas para un 
CA bajo (p. ej., desagrado por los conceptos 
gbstractos) y, por tanto, la utilidad de este (ndi- 
ce esta sujcta a dudas. 

Mason. Lemmon, Wayne y Schmidt (1991) 
han intcntado revivir el enfoque del CA para la 
SILS mediante ecuacioncs de rcgresibn que se 
emplean en el calculo de Cocientes de Abstrac- 
cibn que utilizan la edad, sexo y clase social como 
variables modcradoras. Sin embargo, no pro- 
porcionan ninguna evidencia de la validez del 
CA como fndice de dcterioro cerebral. 

La confiabilidad de la SILS es marginal. 
Las medidas ((picas de consistency interna (co- 
rrelacibn pares-noncs) son de .87 (vocabulario) 
y .89 (abstracciones) y .92 (puntuacibn total). 
Sin embargo, como se sefiala en los Standards 
for Educational and Psychological Testing 
(AKRA, APA y NCME, 1985), los coeficien- 
tes de divisibn en mitades de la variedad pares- 
noncs producen estimados de confiabilidad 
inflados, cuando se trata de pruebas de veloci- 
dad. En cl sentido de que las puntuaciones de 
la SILS se basan en la velocidad en vez del po- 
der, estas confiabilidadcs serdn artificialmente 
alias. Es mbs probable que las confiabilidades 
test-retest scan mds apropiadas para la SILS. 
Estas confiabilidades vari'an de manera consi¬ 
derable en la literatura, pero se acercan al .80 
para la puntuacibn total en mucstras mds gran- 
des y heterogbneas (Johnson, 1987). 

Puesto que la SILS se emplca principalmen- 
tc como prueba de dcteccibn de la inteligencia, 
la validez de este instrumento se vincula, en 
gran medida, con su capacidad para pronosti- 
carCI Totales en pruebas individuates como el 
WA1S o el WAIS-R. Como escribib Johnson 
(1987), literalmente doccnas de estudios de co- 
rrelacibn han investigado la precisibn de la SILS 
como medio de prediccibn del Cl Wechsler 
(p- ej., Zachary, Crumpton y Spiegel, 1985). 
Las correlaciones entre la SILS y la Wechslcr- 
Bellcvue o cl WAIS van de .65 a .90, con una 
mediana de .76 (Johnson, 1987). Con base en 
cstos estudios, Johnson (1987) informa que el 
intervalo de confianza de 95% para el Cl esti- 


mado de la SILS es de aproximadamente ±11 
puntos de Cl. Por ejemplo, una puntuacibn to¬ 
tal de 60 en la cscala Shipley para un varbn de 
40 anos de edad, se convierte en un Cl del 
WAIS-R de 102; en 95% de talcs casos, el Cl 
real de la persona en el WAIS-R caerb dentro 
del rango de 91 a 113 (Zachary, 1986). 

COMENTARIO SOBRE LA SILS 

La SILS es una medida razonablcmente buena 
de la inteligencia general que ha encontrado 
amplio uso en la investigacibn. Adembs. el ins¬ 
trumento aun es bastantc popular como prueba 
de dcteccibn de la inteligencia general y de la 
posible ineflciencia intelectual (Bowers y Pantle, 
1998). Aunque la SILS es titil para la detec- 
cibn intelectual en un rango muy amplio, no se 
le debe utilizar para realizar discriminaciones 
mbs dctalladas. Los clfnicos responsables utili- 
zarbn una prueba de inteligencia individual (p. 
ej., K-BIT, WAIS-1II) cuando sc requicra una 
evaluacibn individual mbs precisa. 

A pesar de que es una prueba de deteccibn 
accptable, la SILS posee varias limitaciones sig- 
nificativas; 

1. La SILS es inapropiada para individuos con 
bajo Cl o para los que tienen discapacidades 
significativas del lenguaje. 

2. La prueba tienc un nivel superior bajo, en 
especial en la seccibn de abstracciones, y no 
se distribuye a los individuos examinados 
que tienen un alto Cl. 

3. La SILS tienc una banda de error que se 
aproxima a 11 puntos de Cl, lo cual puedc 
scr excesivo para muchas aplicaciones. 


BATERIA MULTI NIVEL: PRUEBA 
JDE CAPACIDADES COGNITIVAS 
^(CogAQ 


Una funcibn importante de las pruebas psicolbgi- 
cas consiste en evaluar las capacidadcs de los 
cstudiantes que constituycn un prerrequisito para 
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el aprendizaje tradicional dentro del saldn de cla- 
se. En cl disciio de pruebas para dicho propdsito, 
los psicometias deben enfrentarse al problema 
obvio e irrilante dc quc los jdvenes en edad es- 
colar difieren en gran medida en sus capacidades 
inlelectuales. Por ejemplo, una prueba adecua- 
da para un nine de sexto grado serd demasiado 
f&cil para un alumno dc secundaria, pero sera 
muy diffcil para un estudiante de tercer grado. 

La respuesta a este dilema es una baterfa 
multinivcl, una serie de pruebas superpuestas. 
En una baterfa multinivcl, cada prueba grupal 
sc disena para un nivel espccffico de edad o 
grado escolar, pero las pruebas adyacentes 
poseen cierto contenido comun. Debido a la su- 
perposicidn en contenido entre los niveles ad¬ 
yacentes de edad o grado, cada prueba posce 
niveles inferior y superior apropiadamente ba- 
jos y altos para la evaluacidn adecuada de los 
csludiantcs en ambos extremos de capacidad. 
Adcmds, por lo general, las baterfas mullinivel 
emplean muestras normativas sumamente com¬ 
parables en cada nivel sucesivo. Por todas es- 
tas razoncs, se consideran ideales para estimar 
la preparacidn del alumno para el aprendizaje 
escolar. Casi todos los sistemas escolares en EU A 
emplean cuando menos una baterfa multinivel 
con normas nacionales. 

La Cognitive Abilities Test, CogAT (Prue¬ 
ba de Capacidades Cognitivas) es una de las 
mejores baterfas dc pruebas escolares en uso 
en la actualidad (Thorndike y Hagen, 1993ab). 
La revisidn mds reciente de la prueba es la Edi- 
ci6n Multinivel CogAT, Forma 5, publicada en 
1993. Este instrument se analizard con cicrto 
detalle y despuds se proporcionard un resumen 
de pruebas contrarias. 

ANTECEDENTS Y DESCRIPCION 

La CogAT se derivd de las Pruebas de inteligen- 
cia Lorge-Thomdike, una de las primeras pruebas 
grupales de inteligencia que tenfa el propdsito 
de utilizarse ampliamente dentro de los sistemas 
escolares. La CogAT es, en primer tdrmino, una 
medida de la capacidad escolar, pero tarnbien 
incorpora una baterfa de razonamiento no ver¬ 


bal con reactivos que no lienen relacidn directa 
con la cducacidn formal en la escuela. Las do$ 
baterfas principales, adecuadas para alumnos 
desdc jardfn de ninos hasta tercer grado, se ana- 
lizan de manera breve al final de esta seccidn, 
Aquf se revisa la cdicidn multinivel dirigida a 
estudiantes de 3° al 10° grados. 

Las nueve subpruebas de la CogAT Multi- 
nivel se agrupan en tres baterfas como sigue: 

Baterfa Baterfa Baterfa 

verbal cuantitativa no verbal 

Razonamiento Relaciones Clasificacidn 

Verbal Cuantitativas de Figuras 

Frascs Series dc Analogfas dc 

Incompletas Numeros Figuras 

Analogfas Construccidn Andlisis de 

Verbales de Ecuaciones Figuras 

Para cada subprueba de la CogAT, los reactivos 
sc ordenan .segun el nivel de dificultad en un 
solo protocolo de piueba. Sin embargo, los ni¬ 
veles de inicio y finalizacidn difieren en cada 1 
dc los 8 niveles superpuestos (A hasta H). Asf, a 
todos los individuos examinados se les propor- 
cionan los reactivos apropiados segun el grado. 
Todas las subpruebas, excepto una, emplean un 
formato de opcidn multiple. La excepcidn es 
Andlisis de Figuras, en la quc la persona res- 
ponde con Sf o No a una serie de altemativas. 

Las subpruebas tienen estrictos lfmitcs dc 
liempo que van de los 8 a los 12 minutos. Cada 
una de las tres baterfas puede aplicarse en mcnos 
de una hora. Sin embargo, el manual recomien- 
da tres sesioncs de piueba en dfas sucesivos para 
las nifios pequenos. En el caso de los nihos mayo- 
res, el primer dfa deben aplicarse dos baterfas y al 
dfa siguiente se utiliza un solo periodo dc prueba. 

Muchas subpruebas de la CogAT tienen una 
notable semejanza con partes de la Stanford- 
Binet: Cuarta Edicidn. Por ejemplo, ambas prue- 
bas incluycn reactivos de doblado dc papel. La 
explicaci6n reside en la patemidad comun: 
Robert Thorndike y Elizabeth Hagen desarro- 
llaron ambas pruebas y las dos se publicaron 
en la Riverside Publishing Company. De nuevo 
se ve el caracter hfbrido de las pruebas actuates 
de inteligencia, en cuanto a que las nuevas prue- 




Pruebas de Inteligencia II: Pruebas individuates y grupales • 253 


Ijas incorporan los mcjores aspectos de sus 
pjedecesoras. 

Las puntuaciones naturalcs de cada bate- 
da pueden transformarse en puntuacidn est&n- 
dar normalizada con base en la edad, con media 
de 100 y desviacidn est.lndar de 16. Ademds, 
tsunbidn estdn disponibles rangos percentiles y 
estaninas para los grupos por edad y nivel dc 
grndo. Sc utilizd una interpolation para deter- 
minar las normas de nivel de grado para los 
pcriodos de otono, inviemo y primavcra. 

CARACTERlSTtCAS TECNICAS 

La CogAT se normd conjuntamente (estandari- 
zacidn concurrente) con ires pruebas de apro- 
vcchamiento, las Iowa Tests of Basic Skills 
(Pruebas Iowa de Habilidades Bdsicas), las Test 
of Achievement and Proficiency (Pruebas de 
Ejccuci6n y Rendimiento) y las Iowa Tests of 
Educational Development (Pruebas Iowa de 
Desarrollo Educativo). La estandarizacidn con¬ 
currente con medidas de rendimiento cs una 
prfctica comiin y deseable en el establecimien- 
to de normas para pruebas de inteligencia con 
niveles multiples. La virtud particular de la 
normatizacidn conjunta es que sc determina con 
gran precision la correspondence esperada en- 
tre las puntuaciones de inteligencia y de rendi¬ 
miento. Como consecucncia, los examinadores 
pueden identificarcon cxactitud a los estudian- 
les de bajo rendimiento que nccesitan rcgulari- 
zacidn o dc mayor evaluacidn para descartar 
una posible discapacidad para el aprendizaje. 

La confiabilidad de la CogAT es excepcio- 
nalmcnte buena. En ediciones anteriores, los 
estimados dc confiabilidad Kuder-Richardson 
20 para las baterfas multinivel promediaron .94 
(Verbal), .92 (Cuantitativa) y .93 (No verbal) 
en todos los niveles por grado. Las confiabilida- 
dcs test-retest a seis meses para las formas al- 
temas fueron de .85 a .93 (Verbal), .78 a .88 
(Cuantitativa) y .81 a .89 (No verbal). 

El Manual proporciona un cumulo de in- 
formacidn acerca de validez de contenido, re- 
lacionada con el criterio y de constructo para la 
CogAT; aquf se resumen sdlo los puntos mis 
relevantes. Las corrclaciones entre la CogAT y 


las baterfas de rendimiento son sustanciales. Por 
cjcmplo, la baterfa verbal de la CogAT se 
correlaciona en los rangos de .70 y .80 con las 
subpruebas de rendimiento de las pruebas Iowa 
de habilidades biisicas y las de ejecucidn y ren¬ 
dimiento. 

La CogAT pronostica las calificaciones 
cscolares razonablemente bien. Las correlacio- 
nes van del rango de .30 al de .60, dependien- 
do del nivel de grado, sexo y grupo etnico. No 
parece haber una tendencia clara en cuanto a 
qud baterfa es mejor en el prondstico del pro- 
medio dc calificaciones. Las correlaciones en¬ 
tre la CogAT y las pruebas individuates de 
inteligencia tambidn son sustanciales, y por lo 
comun van de .65 a .75. Estos datos hablan bien 
de la validez de constructo de la CogAT, en 
la medida en que la Stanford-Binet se recono- 
ce de manera amplia como una cxcelcnte me¬ 
dida de la inteligencia individual. 

COMENTARIO SOBRE LA CogAT 

La edicidn multinivel de la CogAT es una prue- 
ba grupal de la inteligencia con fuerte confiabi¬ 
lidad y normas cuidadosas para estudiantes del 
tercer a doceavo grados. La estandarizacidn 
concurrente con dos pruebas de aprovechamicn- 
to es un aspecto bienvenido y pnfctico. En apoyo 
a la validez de la CogAT, las correlaciones con 
calificaciones, rendimiento y otras medidas dc 
inteligencia son bastante robustas. Recicntc- 
mente se ha producido una versidn alemana de 
la CogAT (Perleth, Hofmann, Schauer y 
Wemberger, 1994). 

Ansorge (1985) ha cuestionado si las ires 
baterfas son realmente necesarias. Este autor 
senala que las correlaciones entre las baterfas 
Verbal, Cuantitativa y No verbal son sustancia¬ 
les. Los valores medianos en todos los grados 
son los siguientes: 

Verbal y Cuantitativa: .78 

No verbal y Cuantitativa .78 

Verbal y no verbal .72 

Dado que la baterfa Cuantitativa ofrece po- 
cos aspectos tinicos, desdc un punto dc vista 
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puramente psicomdtrico no existe justifica- 
ci6n para incluirla. Sin embargo, los autores de 
la prueba recomiendan utilizar todas las bate- 
rfas con la esperanza de que las difcrencias en 
desempeno ayudaran a los profesores cn la pla- 
nificacion de estrategias de rcgularizacidn. Sin 
embargo, los autores no defienden mucho esta 
afirmacidn. 

Un recientc estudio de Stone (1994) propor- 
ciona una notable justificacidn para la utiliza- 
cidn de la CogAT como base para la evaluacidn 
de estudiantes. Este investigador encontrd que 
las puntuaciones de la CogAT de 403 alumnos 
del tercergrado proporcionaban una prediccidn 
impartial del aprovechamiento del alumno que 
era mas precisa que las calificacioncs del maes¬ 
tro. Particularmente estas ultimas mostraban 
parcialidad en contra de estudiantes caucdsicos 
y asiaticocstadounidcnscs al pronosticar meno- 
res puntuaciones de aprovechamiento. 



PRUEBA DE INTEUGENQA 
CULTURALMENTE JUSTA (CFIT) 


La Culture Fair Intelligence Test (CFIT; Prue¬ 
ba de Inteligencia Culturalmente Justa; Cattell, 
1940; IPAT, 1973) es una medida no verbal de 
la inteligencia fluida que Raymond B. Cattell, el 
importante psicologo de la medicidn, concibid 
originalmente en el decenio de 1920. El objeti- 
vo de la CFIT consiste en medir la inteligencia 
fluida —capacidad analftica y de razonamien- 
to en situaciones abstractas y novedosas— de 
una manera que estd tan “libre" del prejuicio 
cultural como sea posible. Esta prueba se lla- 
md en un principio la Prueba de Inteligencia 
Culturalmente Libre. El nombre sc cambid 
cuando se hizo evidente la imposibilidad de eli- 
minar por completo las influences culturales 
de las pruebas de inteligencia. 


ANTECEDENTES Y DESCRIPCibN 


nos cnlrc 4 y 8 afios de edad; la Escala 2 se 
cmplca con adultos dentro del rango promedio 
de inteligencia y con nifios entre 8 y 13 anosde 
edad; y la Escala 3 es para adultos con alto ni- 
vel de capacidad y para estudiantes de bachi- 
llerato y universidad. La Escala 1 implica una 
considerable interaccidn entre el examinadory 
la persona evaluada —cuatro de las subpruebas 
se deben aplicar de manera individual. Asf, en 
algunos aspectos la Escala 1 es mis una prue¬ 
ba individual de inteligencia que una prueba 
grupal. Aquf sc analizan s6lo las Escalas 2 y 3, 
dado que dstas son cn realidad pruebas grupales 
de inteligencia. Estas dos pruebas difieren prin- 
cipalmente en el nivel de dificuitad. 

Para cada escala se encuentran disponibles 
dos formatos equivalentes llamados Forma A y 
Forma B. Los autores de la prueba recomiendan 
aplicar ambas formas a cada indi viduo para obte- 
ner lo que se denomina prueba completa. Cada 
forma cn sf misma se conoce como forma corta. 
A pesar de la recomendacidn de utilizar ambas 
formas como una prueba combinada, es muy co* 
train que los usuarios de la CFIT dependan de una 
sola forma breve con prop6sitos de detcccidn. 

Cada forma incluye cuatro subpruebas, 
Series, Clasificacidn, Matrices y Condiciones. En 
la figura 6-9 se presentan reactivos de mucs- 
tra. Por supuesto, cada subprueba estd precedida 
por varios reactivos de prdctica. La prueba com¬ 
pleta estd hdbilmente organizada en un proto- 
colo de ocho pdginas. 

La CFTT es una prueba sumamentc rdpida. 
Cada forma de las Escalas 2 y 3 requierc cerca 
de 30 minutos para su aplicacion, pero sdlo se de¬ 
dican 12.S minutos para la presentacidn de la 
prueba cn sf. Por tanto, los resultados pueden 
ser enganosos en el caso de personas que no le 
dan importancia a la velocidad de ejecucidn en 
la resolucidn de problemas. Por fortuna, la Es¬ 
cala 2 puede utilizarse como una prueba de 
poder sin Ifmitc de tiempo. Sin embatgo, las 
normas para este modo de aplicacidn son limi- 
tadas (IPAT. 1973). 


La CFIT ha atravesado por varias revisiones, 
surgiendo en su apariencia actual en 1961. La 
prueba consiste en tres versiones: la Escala 1 
se utiliza con adultos con retraso mental y ni- 


CARACTERIST1CAS TECNICAS 

Las muestras dc estandurizacidn para las Esca¬ 
las 2 y 3 fueron respetablemente grandes, pero 
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Flgura 6-9. Reactivos de muestra de la Prueba de inteligencia culturalmente jusla. 

Futnlo: Copyright © del Institute for Personality and Ability Testing, Inc. Reimpreso con autorizacibn. 


nosedescriben con suficicntc detalle como para 
detcrminar el grado en que reflejan a la pobla- 
ci6n general. Las muestras de estandarizacidn 
sc caracterizan como sigue: 

El grupo de eslandarizadbn para la Escala 2 estb 
formado por 4 328 varones y mujeres tornados 
como muestra en diversas regiones de EUA y 
Gran Bretaria. Las normas de la Escala 3 se ba¬ 
son en 3 140 casos. que induyen a alumnos es- 


tadounidenses de bachlllerato, divididos por igual 
entre los ulllmos cuatro arios de educacibn me¬ 
dia superior, y Jbvenes adultos en una muestra 
laborel estratificada (IPAT, 1973). 

Las puntuacioncs naturales se convierten a una 
puntuacidn est£ndar normalizada de Cl con 
media de 100 y desviaci6n estdndar de 16. 

Las confiabilidades test-retest, de formas 
altemas y de consistencia interna se encucntran 



































































































































256 • Evaluation pslcologica: Historia, principios y aplicaciones 


(Capitulo 6) 


en general en el rango de .70 para las formas 
individuals de las Escalas 2 y 3. Las confia- 
bilidadcs de la prueba completa son mds alias, 
en general a la mitad del rango de .80. Estos 
resultados se basan en docenas de estudios con 
miles de personas e indican un grado respeta- 
ble de confiabilidad para un instrumento tan 
corto (IPAT, 1973). 

La validcz de la CUT como medida de la 
intcligencia general se ha establecido mds alld 
de cualquier duda razonable. Las puntuacio- 
nes de la CFIT se correlacionan a la mitad del 
rango de .80 con cl factor general de intcligencia 
y muestran rclacioncs consistcntemente fuertes 
—en gran medida en los rangos de .70 y .80— 
con otras medidas convencionalcs de inteligcncia 
(WAIS. WISC, Matrices Progresivas de Raven, 
Stanford-Binet, Otis y la Baterfa de Prueba de 
Aptitud General; vdase IPAT, 1973, p.ll). No 
hay duda de que la CFTI es una prueba bicn 
disefiada, util y vdlida de la inteligencia. 

Pero, Ja CFIT es una prueba cultural- 
mente justa, como afirma su nombre? Un ob- 
jetivo de estc instrumento era el de “reducir al 
mfnimo las influences irrclevantcs del apren- 
dizaje cultural y del clima social” y, por tanto, 
producir una “separacidn mas evidente entrc la 
capacidad natural y el aprendizaje cspecffico” 
(IPAT, 1973). Por desgracia, la evidencia dis- 
ponible indica que la CFIT no es mds exilosa 
que las medidas tradicionales en la busqueda 
de un mbtodo justo culturalmente para la medi- 
ci6n de la inteligencia (Koch, 1984). Por ejemplo, 
Willard (1968) encontrd que 83 nifios afroesta- 
dounidenses con desventajas culturales obtu- 
vieron puntuaciones aproximadamente iguales 
en la Stanford-Binet (X = 68.1) y en la CFIT (X 
= 70.0). Lo que es mds. 14 de los nifios llega- 
ron al nivel inferior dc la CFIT y recibieron la 
puntuacidn mds baja de la prueba con un Cl de 
57, mientras las puntuaciones de la Stanford- 
Binet se distribuyeron en un patrdn mds simi¬ 
lar a una curva con forma de campana. 

COMENTARIO ACERCA DE LA CRT 

La CFIT es una excelente medida breve, no 
verbal, de la intcligencia general. Incluso cuan- 


do se emplean la Forma A y la Forma B p arj 
obtener lo que se conoce como prueba comply 
ta, la CFTT puede aplicarse a grupos grandei 
en menos de una hora. Una advcrtcncia impor. 
tante para los usuarios de la prueba es que | a 
CFIT no ha logrado el encomiable objetivo de 
producir una prueba culturalmente justa. Loque 
es mds, el objetivo en sf puede ser quimdrico: 

.. .las cultures difieren con respecto a la Impor¬ 
tance que le dan a la competence con los com- 
pafieros en la ejacucipn de tareas o en la solu- 
clbn de problemas, a la velocklad o calidad de la 
ejecucldn y a una variedad de otras conduc- 
las relaclonadas con pruebas. Algunas culturas 
enlatizan la solucibn concrete de los proble¬ 
mas mds que la abstracts, llegando con (recuen- 
cia al grado de que un problems carece de slgnl- 
I tea do excepto en un entomo concreto. El mere 
oonceplo de contestar una prueba Inventada de 
manera artificial carece de sentido en dlchas si- 
tuactones (Koch. 1984). 

Existcn dudas dc que incluso sea posible la exts- 
tencia de una prueba culturalmente justa. En 
cdicioncs futuras, los creadores de la CFTT ha- 
rfan bien en cambiarle el nombre a su prueba, 
de modo que los usuarios poco experimcniados 
no le confieran propiedades imaginarias a estc 
instrumento. 

Aunque la CFIT es una prueba valiosa, es no 
cesaria una revisidn y el cstablecimiento dc 
nuevas normas. Tiene una apariencia mas bien 
anticuada. Algunos de los dibujos para los 
reactivos de la prueba son tan pcquefios que 
s61o las personas con visidn perfecta pueden 
inferir las relacioncs figurativas reprcscniadas 
en los componentes de los reactivos. Las ante- 
riores muestras de estandarizacidn se han es- 
pecificado de manera deficiente y parecerfan 
ser muestras de conveniencia mds que represen- 
taciones cstratificadas cuidadosamente sclcc- 
cionadas de la poblacidn en conjunto. 


fcj MATRICES PROGRESIVAS 
M DE RAVEN (RPM) 

Prescntadas originalmente en 1938, las Matri¬ 
ces Progresivas de Raven (RPM) son una 
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ptueba no verbal del razonamicnlo inductivoque 
s e basa en estfmulos dc figuras (Raven, Court 
y Raven, 1986, 1992). Esta prueba ha sido muy 
popular en invcstigacidn bdsica y tambien se le 
uiiliza en ambientes institucionales con propd- 
sitos de deteccidn intelectual. 

ANTECEDENTES y descripcion 

En un principio, la prueba RPM se disend como 
una medida del factor g dc Spearman (Raven, 
1938). Por esta razon, Raven cligid un formato 
especial de prueba que supucstamcnte rcque- 
r(a el ejercicio de g. Se recuerda al lector que 
Speamian definid a g como la “deduccidn de 
correlates”. El tdrmino deduccidn sc refierc al 
proceso de inferencia de relaciones con base 
en semejanzas fundamentales percibidas entre 
estfmulos. En particular, para responder de 
manera correcta a las RPM, los individuos exa- 
minados deben identificar un patrdn recurrente 
de relacidn entre los estfmulos figurativos or- 
ganizados cn una matriz de 3 x 3. Los rcactivos 
seclasifican en orden de dificultad creciente, de 
aquf la referencia a las matrices progresivas. 

La prueba dc Raven cs en realidad una serie 
de tres instrumentos diferentes. Gran parte de 
la confusidn acerca dc la validcz, la estructura 
factorial y similares se deriva dc la suposicidn 
injustificada de que las tres formas deberfan 
producirdatos equivalentes. Sc alienta al lector 
a abandonar cstas hipdtesis sin fundamento. 
Aunque las tres formas dc la RPM sc parecen 
unas a otras, pueden existir diferencias sutiles 
cn las estrategias de solucidn de problemas que 
requicren cada una dc ellas. 

Matrices Progresivas en Color es una prue¬ 
ba con 36 reactivos disciiada para ninos de 5 a 
II anos de edad. Raven incorpor6 colores en 
su vcrsi6n de la prueba para ayudar a mantener 
la atencidn de los sujetos jdvenes. Las normas 
de Matrices Progresivas Estdndar se establecie- 
ron para ninos de seis anos en adelante, aunque 
la mayor parte de los reactivos son tan diffeiles 
‘l uc la prueba es mds adecuada para adultos. 
Esta prueba consta de 60 reactivos agrupados en 
cinco conjuntos de 12 progresiones. Matrices 


Progresivas Avanzadas es similar a la versi6n 
estdndar, pero tiene un nivel superior mds alto. 
La version avanzada estd formada por 12 proble¬ 
mas en el Conjunlo I y 36 problemas en el Con- 
junto II. Esta forma es especialmente adecuada 
para individuos con un intclecto superior. 

CARACTERtSTlCAS TECNICAS 

En Raven y Summers (1986) se presentan las 
normas para Matrices Progresivas en Color y 
Estandar, obtenidas con grandes mucstras cn 
EUA. Se incluyen normas independientes para 
mexicano-estadounidenses y afroestadouni- 
denses. Aunque no se hizo el intento dc utilizar 
un procedimiento de muestreo alcatorio cstra- 
tificado, la seleccidn de distritos escolarcs fue 
tan ampliamente variada que las normas esta- 
dounidenses para ninos parecen sdlidas cn un 
nivel razonable. Saltier (1988) resume las nor¬ 
mas pertinentes para (odas las versiones de la 
RPM. Recientemente, Raven, Court y Raven 
(1992) produjeron nuevas normas para la 
prueba de Matrices Progresivas Estandar, 
pero Gudjonsson (1995) ha hecho surgir la duda 
de que estos datos se hayan visto comprometi- 
dos debido a que no hubo vigilancia durante la 
prueba. 

En cuanto a Matrices Progresivas en Co¬ 
lor, sc informan confiabilidades de divisidn en 
mitadcs dentro del rango de .65 a .94, donde 
los individuos mils jdvenes producen valores 
mds bajos (Raven, Court y Raven. 1986). Para 
Matrices Progresivas Estdndar, un valor tfpico 
de divisidn en mitades es .86, aunque en perso¬ 
nas mds jdvenes se encuentran valores mds 
bajos (Raven, Court y Raven, 1983). Las confia¬ 
bilidades tesl-relesl para las ires formas varfan 
de manera considerable de una muestra a otra 
(Burke, 1958; Raven, 1965; Raven etal., 1986). 
En el caso de adultos normalcs cn los ultimos 
anos de la adolescencia y mayores, son tfpicos 
los coeficienlcs dc confiabilidad entre .80 y .93. 
Sin embargo, para ninos preadolcsccntes, se in¬ 
forman coeficientes de confiabilidad tan bajos 
como .71. Asf, cuando se trata dc individuos 
mds jdvencs, es posible que la RPM no posea 
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la suflcicnte confiabilidad como para justificar 
su ulilizacidn cn la toma de decisiones sobre 
individuos. 

Los esludios analftico-factoriales de la 
RPM proporcionan poco o ningun apoyo a 
la intencidn original de la prueba de medir un 
constructo unitario (factor g de Spearman). 
Varios estudios sobre Matrices Progrcsivas en 
Color revelan tres factores ortogonales (Carlson 
y Jensen, 1980; Wiedl y Carlson, 1976). El Fac¬ 
tor 1 incluye cn gran medida, los reactivos muy 
diffciles y se le puede denominar cierre y razo- 
namiento abstracto por analogfas. El Factor II 
se cataloga como integracidn de patrones a tra- 
vds de identidad y cierre. El Factor III consta 
de los reactivos mis faciles y se define como 
una simple integracidn de patrones (Carlson y 
Jensen, 1980). En resumen, los reactivos 
muy ficiles y muy diffciles en Matrices Pro- 
gresivas en Color parecen vincularse con 
procesos intelectuales diferentes. 

Matrices progrcsivas avanzadas se descom- 
ponc cn dos factores que pueden tener validez 
predicliva por separado (Dillon, Pohlmann y 
Lohmann, 1981). El primer factor comprcnde 
reactivos cn los que la solucidn se obtiene a tra- 
vds de la suma o rcsta de patrones (figura 6-10a). 
Los individuos que tienen un buen dcscmpcno 
en estos reactivos pueden sobresalir en cuanto 
a la toma de decisiones ripidas y cn situacioncs 
donde deben percibirsc las relaciones parte-todo. 
El segundo factor se compone de reactivos en 
los que la solucidn se basa en la capacidad para 
percibir la progresidn de un patrdn (figura 6-10b). 
Las personas que tienen un desempeiio apro- 
piado en estos reactivos pueden tener buena 
capacidad mecinica, asi como habilidades ade- 
cuadas para estimar cl movimicnto proyectado 
y realizar rotacioncs mentales. Sin embargo, las 
habilidades rcpresentadas por cada factor son, 
por el momento, meras conjeturas y requieren 
confirmacidn indepcndicnte. 

Un enorme conjunlo de investigaciones 
publicadas tiene que ver con la validez de la 
RPM. Burke (1958) proporciona un buen resu- 
mcn de los primeros datos, y las conclusiones 
mis rccientes pueden cncontrarse recopiladas 
en Court (1982) y en los manuales actuates de 
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Figura 6-10. Matrices Progresivas de Raven: reactivos 
tfpicos. 

la RPM (Raven y Summers, 1986; Raven, Court 
y Raven. 1983, 1986, 1992). En general, los 
coeficientes de validez en relacidn con pruebas 
de aprovcchamiento van del rango de .30 al de 
.60. Como podrfa esperarse, estos valores son 
un poco mis bajos que los cncontrados en las 
pruebas mis tradicionales (con cargas verba' 
les) de la inteligencia. Los coeficientes de vali¬ 
dez con otras pruebas de inteligencia van del 
rango de .50 al de .80. Tambidn, como podria 
esperarse, las correlacioncs tienden a ser mis 
alias con las pruebas de ejecucidn que con las 
pruebas verbales. En un enorme estudio cn cl 
que participaron miles de escolarcs, Saccuzzo 
y Johnson (1995) concluyeron que Matrices 
Progresivas Estindar y el WISC-R mostraron 
una validez predictiva aproximadamente igual y 
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quc no existe cvidencia de validez diferencial 
entre los ocho grupos dtnicos diferentcs. 

Johnson, Saccuzzo y Guertin (1994) logra- 
ron lo que (casi) es imposible al dcsarrollar una 
forma altema verdaderamente comparable de 
Matrices Progresivas Estindar. Para cada uno 
de los 60 rcactivos originales, desarrollaron un 
reach vo similar que era comparable en tirminos 
de nivel de dificultad y cstrategia cognitiva sub- 
yacentc requerida para la solucidn. Un anilisis 
de confiabilidad de formas altemas con un gru- 
po diverso de 449 nifios que tomaron ambas 
pruebas en orden contrabalanceado reveld un 
coeficiente de confiabilidad de .90. que esti al 
nivel de los datos de test-retest inmediato. En 
esta misma muestra, la distribucidn de puntua- 
ciones no mostrd diferencias en cuanto a des- 
viacidn estindar, asimetrfa y rango de dificultad 
de los reactivos. La media de rcspuestas correc- 
tas fue de 36.1 en MPE y de 35.5 en la nueva 
prueba. En resumen, las dos versiones de la prue- 
ba son casi iddnticas en caracterfsticas psico- 
naStricas generales y tambidn en nivel dc difi¬ 
cultad. La nueva prueba promete satisfacer un 
importante papel en los estudios de investiga- 
ci6n que requieren de la repeticidn de prueba. 


COMENTARIO ACERCA DE LA RPM 

Aunque la RPM no ha cumplido las expectati- 
vas originales de medir el factor g de Spearman, 
la prueba es, sin embargo, un fndice dtil del 
razonamiento no verbal, figurativo. La actuali¬ 
zation reciente de las normas fue un avance 
bien acogido para esta prueba tan conocida, en 
el sentido de que muchos usuarios estadouni- 
denses estaban recelosos de las normas britini- 
cas porconsiderarlas anticuadas y limitadas. Sin 
embargo, las normas adultas de Matrices Pro¬ 
gresivas Estindar y Avanzadas contiouan sien- 
do bastante rcstringidas. 

La RPM es particularmcnte valiosa como 
prueba complementary para nifios y adultos con 
discapacidadcs auditivas, del lenguaje y ffsicas. 
Con frecuencia, estos individuos presentan di- 
ficultades cuando se les evalua con medidas 
tradicionales que requieren atenci6n auditiva. 


expresidn verbal o manipulation ffsica. En 
contrastc, la RPM puedc explicarse a travOs 
de pantomima, si ello es necesario. Lo que es 
mis, la unica vfa expresiva que se requiere del 
examinando es una marca con un lipiz o un 
ademin que denote la altemativa elegida. Por 
tales razones, la RPM es ideal para examinar a 
personas que lienen un dominio limitado del 
idioma inglds. De hecho, la RPM esti tan res- 
tringida en tOrminos culturales como es posi- 
ble: el protocolo de prueba no contiene una sola 
palabra en algun idioma. 

Mills y Tissot (1995) encontraron que Ma¬ 
trices Progresivas Avanzadas idcnlificabacomo 
dotados a una mayor proportion de nifios mi- 
noritarios que una medida mis tradicional de 
la aptitud academica (la Prueba de Capacidad 
Escolar y Univcrsitaria). 

Final mente, debe expresarse una adverten- 
cia: algunos individuos sumamente inteligentes 
y de alto funcionamiento tienen un desempeno 
muy inferior en la RPM. Gregory y Gemert 
(1990) sometieron a prueba (con una varianic 
de la RPM) a casi 100 miembros de cuerpos 
docentes uni versitarios. Un investigador sobre- 
saliente y que habfa llegado a nivel vicepresi- 
dencial, no tuvo la menor idea de c6mo resolver 
los problemas de la RPM y obtuvo puntuacio- 
nes a un nivel aleatorio. Algunas personas dc 
inteligencia superior al promedio simplemente 
no tienen un buen desempeno en tareas de ra¬ 
zonamiento figurativo. Los examinadores ha- 
rfan bien en cuestionar la validez dc una baja 
puntuacibn en el caso de un individuo que en 
otros sentidos es muy exitoso. 


I 


PERSPECT1VA SOBRE LAS PRUEBAS 
CUUURALMENTE JUSTAS 


La Culture Fair Intelligence Test (CHT; Prueba 
de Inteligencia Culturalmente Justa de Cattell) 
y las Matrices Progresivas dc Raven (RPM) se 
citan con frecuencia como ejemplos de pruebas 
culturalmente justas, lo cual es un concepto con 
una historia larga y confusa. Aquf se intentari 
aclarar algunos tOrminos y problemas. 
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El primer asunto a analizar es que las prue- 
bas de intcligencia son tan s6lo muestras de 
aquello que las personas saben y pueden haccr. 
No se debcn materializar y sobrevalorar las 
pruebas de intcligencia. Las prnebas nunca son 
muestras de inteligencia innata o de conoci- 
micnto independicnte de la cultura. Todo co- 
nocimiento se basa en la cultura y se adquierc a 
travds del tiempo. Como senala Scarr (1994), 
no existe nada que se asemeje a una prueba 
culturalmente libre. 

Pero, <,qud sucede con una prueba cultu- 
ralmentc justa que plantca problemas que son 
igualmente familiares (o no familiares) para 
todas las cultures? 6sta pareceria scr una posi- 
bilidad mils realista que una prueba cultural¬ 
mente indepcndiente, pero incluso en este caso 
los cscdpticos pueden tcner dudas. Considdre- 
se la pregunta de qud es lo que significa una 
prueba, lo cual difiere de una cultura a otra. 
En teorfa, una prueba de matrices parecerfa 
igualmente justa para la mayorfa de las cultu¬ 
res. Pero en la prdctica surgen problemas sobre 
equidad. Las personas criadas en cultures occi¬ 


dental estdn cntrenadas en un pensamiento 
lineal, convergente. Se sabe que el propdsito 
de una prueba es encontrar una sola respuesta 
adecuada y hacerlo con rapidez. Si se examina 
la matriz de 3 x 3 dc izquierda a derecha y dc 
arriba hacia abajo, buscando los principios 16- 
gicos invocados en la succsi6n de formas, £puc- 
de suponerse que las personas criadas en Nepal 
o en Nueva Guinea o incluso en las partes mds 
remotas de Idaho hardn lo mismo? La prueba 
puede significar algo diferente para ellos. Qui¬ 
zes la aborden como una medida de la progre- 
si6n esldtica, mds que como una sucesi6n 
16gica. Quizd la consideren como una boberia 
de tal tipo que no es digna de un esfuerzo inte- 
lectual intenso. Suponer que una prueba es 
igualmente justa para lodos los grupos cultura- 
les tan s6lo porque los estfmulos son igualmen¬ 
te familiares (o no familiares), es algo 
inapropiado. Se puede hablar accrca de grados 
de justicia (o injusticia) cultural, pero el con- 
cepto de que cualquier prueba sea culturalmente 
justa en tdrminos absolutos es, con toda segu- 
ridad, un equfvoco. 


RESUMEN 


1, Las pruebas grupales dc inteligencia difie- 
ren de las individuales en cinco aspcctos: 
formato de opcidn multiple contra formato 
de preguntas abiertas, calificacidn mecdnica 
objetiva contra calificacidn del examinador, 
aplicacidn grupal contra individual, emplco 
con fines de detecti6n contra empleo para 
planificacidn de rcgularizaci6n y muestras 
enormes de cstandarizacidn contra mues¬ 
tras simplemente grandes. 

2. La ventaja obvia de las pruebas grupales es 
que puede examinarse con rapidez y efica- 
cia a grandes numeros de personas; la des- 
ventaja es que el individuo evaluado puede 
tener puntuaciones muy por debajo de su 
verdadera capacidad debido a problemas 
motivacionales o dificultad para seguir ins- 
trucciones. 


3. La MAB es una prueba grupal de inteligcn- 
cia, con preguntas de opcidn multiple, di- 
senada como un equi valcnte de lapiz y papel 
para cl WAIS-R. Los Cl de la MAB y del 
WAIS-R se corrclacionan en .82, .65 y .91 
para las Escalas Verbal, de Ejccucidn y Total, 
respectivamcnte. Laconfiabilidad test-retest 
del insliumentoes excelcnle y los andlisis fac- 
toriales sustentan su validez de constructo. 

4. La escala del Shipley Institute of Living 
(SILS) se propuso originalmcntc como un 
(ndice del deterioro intelcctual. La SILS 
consta dc una seccidn dc vocabulario con 
40 reaclivos de opcidn multiple y una sec- 
cidn de abstracciones con 20 reactivos de 
llenado de espacios en bianco. La prueba 
no ha funcionado bien como fndicc de 
organicidad. pero s( satisface una necesidad 
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de un instrumento breve de deteccidn para 
la inteligencia general. 


5. La Cognitive Abilities Test (CogAT) es re¬ 
presented va de muchas baterfas escolares 
multinivel utilizadas cn la actualidad. Las 
nueve subpruebas de la CogAT incluycn 
una baterfa Verbal, una baterfa Cognitiva y 
una baterfa No verbal. La prueba se normd 
de manera conjunta con dos pruebas de 
aprovcchamiento, las pruebas Iowa de ha- 
bilidades bdsicas y las de ejecucidn y apro¬ 
vcchamiento. 

6. La Culture Fair Intelligence Test (CUT) es 
una medida no verbal de la inteligencia flui- 
da que intenta redueir al mfnimo cl prejui- 
cio cultural. La CFIT es adecuada para 
individuos desde los cuatro anos de edad 
hasta la edad adulta, y se presenta en tres 
versiones, cada una de las cualcs consta de 
dos formas cquivalentes; cada una incluye 
cuatro subpruebas: Series. Clasificacidn, 
Matrices y Condiciones. 

7. La confiabilidad de la CFIT es excelente y 
sus puntuacioncs se correlacionan en gran 
medida con otras pruebas de inteligencia 
muy respetadas. La CFIT es una buena me¬ 
dida de la inteligencia. pero es probable que 
tenga tantos lfmitcs culturales como las 
pruebas mils tradicionalcs. La prueba nece- 
sita revisidn y recstandarizacidn. 


8. Matrices Progrcsivas de Raven (RPM) se 
disefid originalmente como una medida del 
factor g de Spearman y es una prueba no 
verbal del razonamiento induclivo que sc 
basa en estfmulos figurativos y que se pre¬ 
senta cn tres versiones difcrcntcs: Matrices 
Progrcsivas en Color (5 a 11 afios de edad), 
Matrices Progresivas Estdndar (seis afios 
hasta la edad adulta) y Matrices Progresi¬ 
vas Avanzadas. 

9. Aunque la RPM es un fndicc confiablc y 
valido de la inteligencia, la prueba ha rc- 
cibido poco apoyo como medida unitaria 
del factor g. En general, los andlisis fac¬ 
torials revelan 2 o 3 factores, incluyendo 
razonamiento por analogfa e integracidn 
simple de patrones. La RPM es util como 
prueba complementaria para personas 
con discapacidades auditivas, del lenguaje 
o ffsicas. 

10. Las pruebas culluralmente justas son una 
abstraccidn idcalizada imposible de lograr 
dentro del mundo real. Incluso el signiftca- 
do de una prueba puede diferir entre gru- 
pos culturales. lo cual afectara la validcz 
de las comparaciones. Algunas pruebas son 
mds justas en tdrminos culturales que otras. 
pero no es posible que ninguna prueba sea 
igualmcnte jusia para todos los grupos cul¬ 
turales. 



tErminos y conceptos 


CLAVE 


Indicc de deterioro intelectual 


p. 249 


Prueba culluralmente justa 


p. 256 
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Tema 7A 

Pruebas con poblaciones especiales 


Orfgenes de las pruebas para poblaciones especiales 

Obligacibn legal de evaluar a las personas con discapacidades 

Pruebas que no requieren del lenguaje 

Pruebas que no requieren la lectura y pruebas con reduccibn molora 

Ejemplo de caso 7-1. El reto de la evaluacibn en la parblisis cerebral 

Pruebas para individuos con alteraciones visuales 

Evaluacibn de la conducta adaptaliva en el retraso mental 

Resumen 

Tbrminos y conceplos clave 


Las pruebas individuales y grupales de 
la inteligcncia que se revisaron en capftulos 
antcriores son adecuadas para personas con ca- 
pacidades normales o casi normales en habla, 
Judicibn, visibn. movimiento y capacidad inte- 
lectual general. No obstante, no todo individuo 
Maminado cae dcntro del espectro habitual de 
capacidades ffsicas y mentales. En razbn a su 
juventud, discapacidad ffsica, intelecto dismi- 
wido o desventajas de lenguaje, una gran pro- 
porcibn de la poblacibn queda fuera del alcance 


de las pruebas y procedimientos tradicionales. 
Segun el Census Bureau de EUA, cerca de 25 
millones de cstadounidenses (1 dc cada 10) 
tienc una discapacidad grave que le impide 
realizar una o mbs actividades o funciones 
(www.census.gob, 1998). Estc cslimado no in- 
cluye a personas que viven en instituciones. En 
estos casos especiales se necesitan pruebas ori¬ 
ginates para la evaluacibn vblida. En el tema 7A, 
Pruebas con poblaciones especiales, se analizan 
los instrumentos disenados para las consultas 
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excepcionales y diffcilcs, como las de perso¬ 
nas con discapacidades sensoriales/motoras, 
inmigrantes recientes que provienen de pafses 
que no son de habla inglesa, e individuos con 
deficicncias intelcctuales importanlcs. En el 
Tema 7B, Predisposicidn de prueba y otras 
controversias, se continua con un tema que re- 
quicre caulela y en el que se presentan varias 
preocupaciones acerca del uso y significado d< 
las calificaciones en pruebas de inteligencia. 


ORIGENES DE LAS PRUEBAS 
PARA POBLAQONES ESPECIALES 


En el decenio de 1950, surgid en EUA un com- 
promiso renovado hacia las necesidades y de- 
rechos de las personas discapacitadas ffsica y 
mentalmente (Maloney y Ward, 1979; Patton, 
Payne y Beime-Smith, 1986). Las actitudes de 
la socicdad hacia aquellos que tienen necesida¬ 
des especiales cambiaron de un menosprecio 
evidente a una postura de mayor apoyo, lo que 
favorecid nucvos programas c iniciativas en 
favor de las personas con discapacidad. El pro- 
grcso ha sido lento, pero ya no sorprende ver 
instalaciones sanitarias con acceso para sillas 
de ruedas para personas con impedimcntos ff- 
sicos, libros impresos en tipo mas grande para 
individuos con alteraciones visuales o progra¬ 
mas de televisidn con subtftulos en cl mismo 
idioma para personas con discapacidades audi- 
tivas. Lo que es mds, cada vez se satisfaccn mds 
las necesidades especiales de los ciudadanos 
con rctraso mental a travds de pequenos cen- 
tros de atenci6n comunitaria, en vez de institu- 
ciones masivas e impersonates. 

A principios del decenio de 1970, la reno- 
vada preocupacidn por las necesidades de las 
personas con discapacidad se tradujo en una 
legislacidn federal. En 1973 se aprobd la Ley 
publica 93-112, que sirvid como una “Decla- 
racidn de derechos” para los individuos con 
discapacidades. Esta ley prohibid la discrimi- 
nacidn con base en la discapacidad. Dos ados 
despuds, sc aprobd el Decreto de educacidn para 
todos los ninos con discapacidades (Ley publi¬ 


ca 94-142), lo cual constituyd un hito. Esta ley 
dccretaba que todos los ninos discapacitados 
en edad escolar recibicran cvuluacidn y opor- 
tunidades educativas apropiadas. En particular, 
se instruyd a los psicdlogos para que evaluaran 
a los nifios en todas las Ureas de posible limita- 
cion —mental, conductual y ffsica— y que uti- 
lizaran instrumentos validados para dichos 
propdsitos expresos. 

En este tema sc analizan las pruebas que 
pueden utilizarsc para la cvaluacidn de perso¬ 
nas con discapacidades sensoriales, motoras o 
mentales. No obstante, antes de analizar las 
pruebas especfficas, se revisardn ciertas distincio- 
nes entre los tipos de pruebas disponibles para 
las evaluaciones excepcionales. El lector tambidn 
apreciard un resumen de los ordenamientos le¬ 
gates que han dado forma a las prdcticas de 
cvaluacidn con individuos discapacitados. 

ENFOQUES PARA LA EVALUACI6N 
DE POBLAQONES ESPECIALES 

Las pruebas especiales se disenaron inicialmen- 
te a principios del siglo XX para examinar a 
inmigrantes que no hablaban inglds, personas 
con sordcra e individuos con defectos del habla 
(DuBois, 1970). Estos primeros instrumentos 
especiales eran, en gran medida, pruebas de 
cjccucidn o pruebas que no utilizaban el len- 
guaje y podfan aplicarse a travds de mfmica. La 
persona examinada manipulaba objetos o utili- 
zaba Idpiz y papel para realizar (areas de fdcil 
comprensidn, como trazar un camino a travds 
de un laberinto. 

Tambidn se han disehado instrumentos es¬ 
peciales para individuos que no pueden leer, 
pero poscen la capacidad para comprendcr el 
inglds hablado. Estas pruebas que no requicren 
de la leclura se dirigen a ninos pequenos y a 
otras personas iletradas que, sin embargo, 
pueden comprendcr y seguir instrucciones ver- 
bales. Muchas pruebas que no requieren la lec- 
tura, implican la manipulacidn dc objetos. No 
obstante, una prueba de este tipo tambidn pue- 
dc evaluar las habilidades de comprensi6n del 
lenguajc al utilizar un formato de vocabulario 
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con imdgencs: el cxaminador dice una palabra 
y |a persona evaluada senala un dibujo que re- 
ptesenta la palabra cnlre un conjunto de image- 
n es. Mels adelante se analizan varias pruebas de 
vocabulario con ilustracioncs. 

Una prueba con rcduccibn motora requi¬ 
re cl minimo de salida motriz para la respuesta. 
En una prueba de esle lipo, la persona sblo lie- 
ne que sciialar o haccr un ademdn hacia la res- 
puesta correcta entre varias altcrnativas. Por 
ejemplo, un individuo con pardlisis cerebral 
podrfa responder a los reactivos de vocabula¬ 
rio con imdgcnes al colocar una mano sobre la 
altemativa elegida. Algunas pruebas que no 
requieren Icctura —en particular aquellas que 
utilizan un formato de vocabulario con imdge- 
ncs— tambidn son con rcduccibn motora. 

Por ultimo, se debe mencionar que varios 
dispositivos importantes de evaluacibn cn rca- 
lidad no son pruebas. Un inventario del desa- 
rrollo es un instrumento estandarizado para 
observar y valorar el dcsarrollo conductual en 
lactantcs y ninos pequenos. En general, estos 
insirumentos analizan los principals hitos del 
dcsarrollo, como sentarse por sf solo, ponerse de 
pie sin ayuda, etc. Una caractcrfstica de dichas 
hcrramientas es que la persona “examinada” no 
realiza la prueba por sf misma o, en todo caso, 
hace algo fuera de lo comun. Un inventario del 
dcsarrollo es, en realidad, sblo una forma estruc- 
turada dc observacibn. De la misma mancra, 
una escala conductual es un instrumento para 
determinar el perfil dc habilidadcs (y quizbs 
cxcesos) conductuales exhibidos por un nifio o 
un adulto con retraso. En general, las escalas 
conductuales las llena un adulto familiarizado con 
la persona (padre, maestro o psicologo). 

I OBLIGACION LEGAL DE EVALUAR 
A LAS PERSONAS CON 
DISCAPACIDADES _ 


Muchas de las prdcticas de evaluacibn con per¬ 
sonas que tienen discapacidadcs son rcsultado 
directo de la legislacibn y de casos judiciales. 
Como antecedente para el anblisis de las prue¬ 


bas y procedimicntos especfficos, se ofrecc una 
breve revision de las leyes publicas referentes 
a la evaluacibn de personas con discapacidades. 
La cobertura es propositivamente breve. Los 
lectores pueden cncontrar analisis mds am- 
plios cn Bruycre y O’kceffe (1994), Salvia e 
Ysseldyke (1991). y Saltier (1988). 

LEY PUBUCA 94-142 

En 1975, el Congreso de EUA aprobb una ley 
obligators de cducacibn especial, la Ley Pu- 
blica 94-142, conocida como Decreto de edu- 
cacibn para todos los ninos con discapacidades.* 
Scgun Ballard y Zettel (1977) esta ley sc disefid 
para satisfacer cuatro metas principalcs: 

1. Asegurar que los scrvicios dc cducacidn es¬ 
pecial estdn disponibles para todos los ni¬ 
nos que los requieran. 

2. Garantizar que las decisiones sobre los scr¬ 
vicios para estudiantes discapacitados sean 
justas y apropiadas. 

3. Establecer requisitos especfficos de adminis- 
tracidn y auditorfa para la educacidn espe¬ 
cial. 

4. Proporcionar fondos fedcralcs para ayudar a 
los cstados a educar a los estudiantes con 
discapacidad. 

Muchas de las prbcticas dentro dc la cvalua- 
cidn de las personas con impedimentos se deri- 
van directamcnte dc las disposiciones de la Ley 
Publica 94-142. Por ejemplo, la ley espccifica 
que cada estudiante con discapacidad debe rc- 
cibir un Plan Educalivo Individualizado (IEP, 
del inglds individualized education plan) con 
base en una cvaluacidn completa de parte de 
un equipo multidisciplinario. El IEP debe deli- 
mitar los objetivos a largo y corto plazo y espe- 
cificar los planes para lograrlos; ademas, indicar 
la manera en que se evaluat'd el progreso hacia 
estos objetivos. Los padres deben participar dc 


* Cada ley del Congreso recibc dos numcros, uno que 
se refiere a la legislatura particular que la aprobd, y cl 
olro a la ley en st; por tanto, la Ley Piiblica 94-142 es 
la ley 142 aprobada por la Legislatura numcro 94. 
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mancra fntima en este proceso y aprobar los 
aspectos pailiculares del IEP. 

En relacidn con estas practicas dc prueba, 
la LP 94-142 incluye varias disposiciones dise- 
fiadas para asegurar que los procedi mientos y 
actividades de cvaluacidn sean justos, equitati- 
vos y no discriminatorios. Salvia e Ysseldyke 
(1988) resumen estas medidas como sigue: 

1. Las prucbas deben seleccionarse y aplicarse 
de tal modo que no sean discriminatorias en 
tdrminos raciales y culturules. 

2. Hasta donde sea posible, debe evaluarse a 
los estudiantes en su lengua matema o for¬ 
ma de comunicacidn 

3. Las pruebas deben validarsc para el propdsi- 
to espccffico para el cual se utilizan. 

4. La aplicacidn dc las pruebas debe llevarla a 
cabo personal entrenado, de conformidad 
con las instrucciones que proporciona el au- 
tor de la prueba. 

5. Las pruebas utilizadas con estudiantes deben 
incluir aquellas disenadas para proporcionar 
informacidn sobre necesidades educativas 
especi'Ficas y no s6Io un cocientc de inteli- 
gcncia en general. 

6. Las decisioncs sobre estudiantes deben ba- 
sarse en algo mds que el desempefto en una 
sola prueba. 

7. Las valoraciones debe rcalizarlas un equipo 
multidisciplinario que incluya a] menos a un 
maestro u otro especialista con conocimien- 
tos en el drea donde se sospecha la existen- 
cia de discapacidad. 

8. La cvaluacidn de los ninos debe realizarsc 
en todas las dreas relacionadas con una 
discapacidad especffica, incluyendo —cuan- 
do sea apropiado— salud, visidn, audicidn, 
estado social y emotional, intcligcncia ge¬ 
neral, descmpcfio acaddmico, habilidadcs dc 
comunicacidn y habilidadcs motoras. 

La LP 94-142 tambidn contiene una disposi- 
cidn para que se coloquc a los estudiantes con 
discapacidad en cl ambicnte menos rcstrictivo 
—aquel que permita la mayor oportunidad po- 
siblc de interaccidn con estudiantes no discapa- 
citados. La instruccidn por separado ha de darse 


sdlo cuando la naturaleza o gravedad del i m . 
pcdimento es tal que no puedan lograrse las 
melas educativas en el saldn de clases regular. 
Por ultimo, la ley contiene una clausula que ga- 
rantiza una audiencia impartial para resolver 
conflictos entrc los padres de ninos con disca¬ 
pacidad y el sistema escolar. 

En general, las medidas de la LP 94-142 
han proporcionado un fuerte fmpetu al dcsa- 
rrollo de piuebas especializadas con discfio, 
normas y validcz establccidos para niiios con 
discapacidades cspecificas. Por ejemplo, en la 
evaluation de un nirio con altcraciones visua- 
les, las disposiciones de la LP 94-142 virtual- 
mente ordcnan que cl cxaminador utilice una 
prueba con normas adecuadas, discnada justo 
para esa poblacidn, en vez de basarse en ins- 
trumentos tradicionales. 

LEY PUBLICA 99-457 

En 1986, el Congreso de EUA aprobd varias 
enmiendas al Decreto de educacidn para todos 
los niiios con discapacidades, aumcntando las 
disposiciones de la LP 94-142 para incluir a 
los ninos preescolares con discapacidades. La 
Ley Publica 99-457 requiere que los estados 
proporcionen educacidn publica gratuita v apro- 
piada a ninos discapacitadas entrc los 3 y 5 anos 
de edad; tambidn ordena subsidios para los es¬ 
tados que ofrecen servicios educativos interdis- 
ciplinarios a lactantes e infantes discapacitados 
y sus familias, con lo cual sc cstablccc un incen- 
ti vo para los estados que proporcionan atencidn 
a ninos con discapacidades, desde cl nacimien- 
to hasta los dos anos. Esta ley tambiln impulsa 
cl dcsarrollo y validacidn dc pruebas c inventa- 
nos conductuales para lactantes. Despuds de todo, 
la identificacidn precisa y temprana de los niiios 
en riesgo parecerfa ser un primer paso impor- 
tante en la intervened interdisciplinaria eficaz. 

DECRETO SOBRE LOS ESTADOUNIDENSES 
CON DISCAPACIDADES 

El Decreto sobre los estadounidenses con 
discapacidades (ADA, del inglds Americans 




Scsgo de una prueba y oxamen de poblaclones especiales »267 


r r 


Hh Disabilities Act), aprobado en 1990, 
ohfbc la discriminacidn, tanto en el sector 
oiSblico (p- ej., instancias de gobiemo y entida- 
dcs que reciben subsidios fedcrales) como en el 
rivado (p. ej.. corporaciones y otros emplea- 
dojes que obtienen lucro), en contra de indi viduos 
calificados con discapacidades. Unadisposicidn 
Jel ADA en cuanto a las pruebas psicoldgicas, 
e s que las instituciones deben realizar arreglos 
razonablcs para evaluacidn de las personas con 
discapacidades, que incluyen cambios en el 
niedio de la prueba, Ifmitcs de tiempo e incluso 
(en pocas ocasiones) en el contcnido de la mis- 
ma- Un ejemplo de un arreglo apropiado en el 
medio de la prueba es la presentacidn en 
' audiocinta de los reactivos para personas con 
alteracioncs visuales. Por otro lado, cambiar una 
pnieba de su versidn impresa a la de lenguaje 
de signos para personas con deterioro auditivo 
se considerarfa una traduccidn a otro idioma y 
no un simple cambio de medio. 

En la mayor parte de los arreglos de prue¬ 
ba que exige cl ADA, es neccsario cambiar los 
Ifmites de tiempo aumentdndolo. Esto hacc sur- 
girproblcmas en la interpretacidn de la prueba, 
en especial cuando es esencial un estricto lfmi- 
tc de tiempo para la validez de una prueba. Por 
ejemplo, Willingham, Ragosta, Bennett y cola- 
boradores (1988) encontraron que el aumento 
en Ifmitcs de tiempo en la SAT reduefa de ma- 
nera significativa la validez de la prueba como 
medio de prediccidn de las calificacioncs en el 
primer afto de universidad. Esto fue particular- 
mente cierto en el caso de personas evaluadas 
que tenfan discapacidades para el aprendizaje, 
cuyas calificacioncs en el primer aflo fucron 
mucho menores a las pronosticadas por sus ca¬ 
lificacioncs en la SAT. Asf, aunque parece jus- 
toproporcionar tiempo adicional en una prueba 
cuando sc ha cambiado el medio de la misma 
(p- ej., preguntas grabadas en audiocinta que 
reemplazan la versidn impresa), desde un pun- 
to de vista psicomdtrico, el reto consiste en de- 
terminar que tanto tiempo adicional deberfa 
proporcionarse de modo que la prueba modifi- 
cada sea comparable con la versidn original. 
N'ester (1994) y Phillips (1994) proporcionan 
perspectivas cuidadosas acerca del rango de 
‘“tcglos razonables requeridos por el ADA. 


Las implicaciones del ADA con respecto a 
las pruebas de personaiidad son poco claras, 
pero pueden ser sustanciales. Una medida es- 
tablecida por dste es que no pueden aplicarse 
pruebas m&Jicas antes de ofrecer un empleo. 
Si las pruebas de personaiidad se interpretan 
como de naturaleza "mddica”, esto podrfa re- 
ducir de manera abrupta el uso de las mismas 
en algunos exdmcncs rclacionados con cl em¬ 
pleo de personas con discapacidades (Klimoski 
y Palmer, 1994). A1 momentode la publicacidn 
de la edicidn en inglds de este libro, la interpreta- 
ci6n del ADA todavfa sufre modificacioncs por 
los desaffos legalcs y pautas administrativas. 

Ahora que se han resumido los antecedcn- 
tes legales de la evaluacidn de personas con 
necesidades especiales, la atencidn se centra en 
una revision de los instrumentos tfpicos ulili- 
zados para examinar a individuos con discapa¬ 
cidades. Se organizd la revision alrededor de 
los siguientes temas: pruebas que no requieren 
el lenguaje ni la lectura, pruebas con reduccidn 
motora, pruebas para individuos con alteracio- 
nes visuales y evaluacidn de la conducta 
adaptativa en el retraso mental. 


PRUEBAS QUE NO REQUIEREN 
DEL LENGUAJE 


Como recordarci el lector, las pruebas que no 
requieren lenguaje demandan poco o ningun 
lenguaje escrito o hablado de parte del exaini- 
nador o de la persona evaluada. Asf, son parti- 
cularmente adccuadas para la evaluacidn de 
personas que no hablan el inglds, individuos 
con discapacidades del habla y personas con 
pocas habilidades de lenguaje. Estos instrumen¬ 
tos tambidn pueden utilizarsc con personas que 
no tienen discapacidades. 

ESCALA INTERNACIONAL LETTER 
DE EJECU06N-REVISADA (UPS-R) 

La Leiter International Performance Scale- 
Revised (fiscal n Intemacional Leiter de Ejecucidn- 
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Revisada; LIPS-R: Roid y Miller, 1997) es una 
revisidn rcciente de una prueba (fpica y muy 
respctada de la inteligencia no verbal y de las 
capacidades cognitivas (Leiter, 1948, 1979). 
Leiter disefid una edicidn experimental de la 
prueba en 1929 para evaluar la inteligencia de 
personas con alteracioncs auditivas, trastornos 
del habla, bilingUcs o que no hablaban inglds. 
La escala sc probd en un programa piloto con 
varios grupos dtnicos en Hawai, incluyendo a 
nifios de ascendencia japoncsa y china. La pri¬ 
me ra edicidn se basd en los rcsultados de prueba 
para nifios estadounidenses, estudiantes de ba- 
chillerato y rcclutas del ejeroito en la segunda 
Guerra Mundial. 

Aunque muy clogiada y de amplio uso des¬ 
puds de su publicacidn inicial, esta prueba re- 
cibid fuertes crfticas en afios recientes debido a 
la deficiencia de sus iluslracioncs y a sus nor- 
mas obsoletas. La revisidn de la escala Leiter 
responde hdbilmcnte a todas las crfticas y la 
LIPS-R merecc una amplia utilizacidn como 
medida culturalmente reducida de la inteligen¬ 
cia no verbal. 

Un aspecto notable de la escala Leiter es la 
completa eliminacidn de instrucciones verba- 
les. La escala no requiere una sola palabra 
habiada por parte del examinador o del exarru- 
nando. Con un rango de edadcs de los 2 a los 
20 afios y 11 meses, la Leiter-R es particular- 
mente iddnea para nifios y adolescentes cuyas 
habilidades en el idioma inglds son pocas. Esto 
incluye a nifios con cualcsquiera de los siguien- 
tes aspectos: no angloparlantes, con autismo, 
lesion cerebral traumatica, alteracioncs del 
habla. problemas auditivos y que provienen de 
un ambiente econdmicamcntc bajo. La prueba 
tambidn es util para la evaluacidn de problemas 
de atencidn, como se describe a continuacidn. 

La tarea de la prueba consiste en que el nifio 
o cl adolescente equipare pcquefias tarjetas 
laminadas bajo las ilustraciones correspon- 
dientes en un folleto colocado en forma de atril 
(figura 7-1). La prueba es sin Ifmite de tiem- 
po. Debido a que los reaclivos iniciales son mds 
que obvios, la mayorfa de los individuos exa- 
minados comprcnden con rapidez el propdsito 
sin nccesidad de una demoslracidn con senas. 



Figura 7-1. Reactlvo caracterlstlco de la Escala Inler- 
nacional Leiter de EjecuckJn-Revtsada. 


La LIPS-R conticnc 20 subpruebas organiza- 
das en cuatro dominios: Razonamiento, Visua- 
lizacidn, Memoria y Atencidn. No todas las 
subpruebas se aplican a todos los nifios. Por 
ejemplo, la subprueba de Rotacidn de Figu¬ 
ra es demasiado diffcil para nifios de dos afios de 
edad, y la subprueba de Rcconocimiento Imrie- 
diato es demasiado fdcil para los adolescentes 
evaluados. Las cuatro subpruebas de Razona¬ 
miento incluyen clasificacidn y analogies de 
disefio. Las seis subpruebas de Visualizacidn 
incluyen equiparacidn, figura-fondo, doblado 
de papel y rotacidn de figura. Las ocho sub¬ 
pruebas de Memoria incluyen capacidad de 
memoria, memoria espacial, memoria asocia- 
tiva y memoria de rcconocimiento demorado. 
Las dos subpruebas de Atencidn constan de una 
prueba de subrayado (p. ej.. marcar todos los 
cuadrados impresos en una p&gina completa de 
formas gcomdtricas) y una medida de atencidn 
dividida (p. ej., observar una muestra en movi- 
miento y clasificar simultdneamente tarjetas de 
manera correcta). 

La LIPS-R produce un Cl mixto con la 
media familiar de 100 y desviacidn estdndarde 
15. La prueba lambidn produce puntuaciones 
escalares de subprueba con media de 10 y des¬ 
viacidn cstdndar de 3, asf como una variedad 
de puntuaciones mixtas utiles para el diag- 
ndstico clfnico. Las normas de la prueba se 





Sesgo de una prueba y examen de poblaciones especiales • 269 


c stablecieron con mils de 2 000 ninos y adoles¬ 
ces, de los 2 a los 21 afios de cdad. Con los 
datos estadfsticos del censo dc 1993, se estrati- 
(\c6 cuidadosamente a estos individuos scgun 
raza. edad, gdnero, clase social y region geogrd- 
fica. La confiabilidad dc consistcncia interna 
para las subpruebas, calificaciones de dominio 
y calificaciones de Cl cs excelenle. Los cocfi- 
cientes a tfpicos se cncucntmn desde la parte 
alta del nivel de .80 para las subpruebas hasta 
la parte baja del de .90 para las calificaciones 
de dominio y de Cl. Extensos estudios sobre 
parcialidad de los reactivos revelan que dstos 
parecen funcionar de manera similar en grupos 
raciales dilerentes (mucstras de personas de raza 
blanca, afroestadounidenses e hispanos), es 
deeir, no existe evidencia de parcialidad (defi- 
nida como el funcionamiento diferencial dc los 
reactivos). Junto con el hccho dc que la prueba 
es totalmente no verbal, la ausencia dc parcia¬ 
lidad de prueba indica que la eseala LIPS-R es 
una buena eleccidn para la evaluacidn cul- 
turalmcnte reducida de ninos que provicnen de 
minorfas. 

Aunque en estc momento la investigacidn 
de correlacidn con esta eseala es escasa, los 
estudios con la primera cdicidn indican fuertes 
relacioncs con las calificaciones de otras prue- 
basde inteligcncia. Porejemplo, la eseala Leiter 
yel Cl de Ejecucidn del WISC se correlacionan 
cn un punto cercano al rango de .80; las corre- 
laciones con cl Cl Verbal del WISC se locali- 
zan mds en el rango de .60 (Arthur, 1950; Matey, 
1984). Reeve, French y Hunter (1983) compa- 
raron la eseala Leiter y la Stanford-Binet: For¬ 
ma L-M como medios de prcdiccidn de las 
calificaciones en la Prueba de ejecucidn Me¬ 
tropolitan (MAT) de 60 alumnos de jardfn de 
ninos. Las correlaciones fueron dc .77 entre la 
Stanford-Binet y el total de la MAT y de .61 
entre la Leiter y el total de la MAT. Los autorcs 
senalan que aunque la Stanford-Binet resul¬ 
ts ser un medio de prediccidn marginalmcnte 
major de la ejecucidn individual, los ninos con 
problemas auditivos, del habla o ambos pue- 
den requerir la eseala Leiter u otros instrumen¬ 
ts no verbales. 

La LIPS-R es una revisidn bien recibida 
•kuna prueba obsoleta. En manos de un clrni- 


cocuidadoso, es util para la evaluacidn intelec- 
tual de ninos con habilidades deficientes cn el 
idioma inglds. Otros de sus usos incluyen la 
cvaluacidn del trastomo por deficit de alencidn 
con hiperactividad (en este sentido son impor- 
(antes las comparaciones de las subpruebas de 
Atencidn con otros dominios) y la valoracidn 
de la inteligencia dotada en ninos pequenos 
(para esta aplicacidn resulta invaluable el Ifmi- 
te superior extremadamente alto de la prueba). 
Mientras los revisores han advertido en contra 
dc utilizar la eseala Leiter original con propd- 
sitos de asignacidn o toma de decisiones (Sattler, 
1988; Salvia e Ysscldike, 1991), la eseala Leiter 
revisada esta mejor en cuanto a calidad psico- 
metrica y excelencia en la estandarizacidn. 


PRUEBAS DE DIBUJO DE LA FIGURA 
HUMANA 

La mayorfa de los ninos disfrutan dibujando 
figuras humanas y lo hacen de manera rutina- 
ria y espontdnea. Desde principios del siglo XX, 
los psicdlogos han intentado utilizar esta con- 
ducta casi instintiva como base para medir el 
dcsaiTollo intelectual. La primera persona en 
utilizar cl dibujo de la figura humana (DFH) 
como prueba cstandarizada de inteligencia fue 
Florence Goodenough (1926). Su piueba, co- 
nocida como Test del Dibujo de la Figura 
Humana, fue revisada por Harris (1963) y sc 
le cambid el tftulo por el de Test de Dibujo 
Goodenough-Harris. Recientcmentc, Naglicri 
(1988) adaptd la tdcnica del DFH. El enfoque 
adicional de Gonzales (1986) nose revisa aquf. 
Tambidn deberia mencionarse que los dibujos 
dc la figura humana se utilizan ampliamente 
como medidas de adaptacidn emocional, pero 
aquf no sc analizard esa aplicacidn. 

El Test de Dibujo Goodenough-Harris es 
una prueba breve, no verbal, de inteligencia que 
puede aplicarse dc manera individual o grupal. 
Goodenough (1926) publied la primera edicidn 
de esta prueba, mientras Harris (1963) propor- 
ciond importantes mejorfas en cuanto a califi- 
cacidn y estandarizacidn, incluyendo el uso de 
un Cl de desviacidn. En tdrminos estrictos, cl 
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test Goodenough-Harris no satisfacc los critc- 
rios de una prueba que no requiere del lengua- 
je, en el sentido dc que el examinador debe 
trasmitir ciertas instrucciones en espanot o por 
medio de un interprete. No obstante, las instruc¬ 
ciones son breves y b£sicas ("quiero que hagas 
un dibujo de un hombre (o mujer]; haz el mejor 
dibujo que pucdas”). El test Goodenough-Harris 
es, para propdsitos prScticos, un instrumento 
que no requiere del lenguaje. 

El propdsito de esta prueba es el de medir 
la madurez intelectual, no la habilidad artfsti- 
ca. Asi, la gufa de califtcacidn enfatiza la pre- 
cisidn de la observacidn y el desarrollo del 
pensamiento conceptual. El nifio recibe bonifi- 
cacidn por incluir partes y dctalles del cuerpo, 
asf como por brindar perspectiva, proporcidn 
realista y dar la implicacidn de libertad de mo- 
vimiento. 

Los 73 elementos a calificar se selecciona- 
ron segun el siguiente criterio: 

1. Los elementos deben mostrar un incremento 
regular y bastante r.lpido con la edad, en el 
porcentaje de nifios que pasan el punto. 

2. Los elementos deben mostrar una relacidn 
con alguna medida general de la inteligen- 
cia. 

3. Los elementos deben diferenciar enlre nifios 
con altas calificacioncs en la escala comple- 
ta y aquellos que ticnen bajas calificaciones 
en la misma (Harris, 1%3). 

En la figura 7-2 sc presenta un dibujo de mucs- 
tra con calificacidn reactivo por reactivo. 

Ademas de la escala de Hombre, la revi- 
si6n Harris (1963) lambiln incluye dos formas 
adicionales: la escala de Mujer y la escala de Sf 
mismo. Para estas dos ultimas escalas se ins- 
truyc a las personas evaluadas a que hagan un 
dibujo de una mujer.y un dibujo de sf mismos. 
Las calificaciones en las escalas dc Hombre y 
de Mujer ticnen una muy alta correlaci6n para 
personas de cualquiera de ambos sexos (r = .91 
a .98). Estas versioncs pueden considerarse 
como formas equivalentes. La escala de Sf 
mismo tenfa la intencidn de scr una prueba 
proyectiva del autoconcepto. No obstante, el 


Haz un dibu|o da un hombra. Haz #1 mc|or dibujo q u , 
puodns A&egurale da dlbujar ol hombra complaig 
no »dlo au cabeza y hombros. 
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Nota: Esta estuonco de una nifla de ocho ados de edad se 
convierte a una Puntuocidn Estdndar de 118 y a un rango 
percentll de 68. 


Figura 7-2. Test de dibujo de Goodenough-Harris eon 
calificackin de cada reactivo. 

Fuente: Reimpreso coo autorizacion de Harris, D. B 
(1963). Children's drawings as measures ol tnlelleciuil 
maturity. Nueva York: Harcourt Brace y World. CopyrigM 
01963 de The Psychological Corporation. ReproducldO 
con autortzacibn. Derechos reservados. 
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autoconcepto es un conslructo confuso difi'cil 
de objelivar. La escala de Sf mismo se ha hc- 
cho cn gran medida a un lado, aunque algunos 
psicdlogos la emplcan simplcmcntc como una 
extension no calificablc dc la entrevista clfnica. 

La mucstra dc cstandarizacidn del Test de 
Qihujo Goodcnough-Harris file arnplia (N =2 975 
nifios), variada en tirminos geogrificos (de 
Areas urbanas y rurules a lo largo de EUA) y 
scleccionada de manera cuidadosa para cqui- 
pararsc con los valorcs de poblacidn en EUA 
en cuanto a ocupacidn de los padres. La prueba 
eubre de los 3 a los 16 anos de edad, pero las 
normas son mejorcs para edadcs dc 5 a 12 anos. 
Mis alia de los 12 afios, los individuos evalua- 
dos comicnzan a acercarse a una asfntota de 
ejecticidn y se rcducen las difercncias segun la 
edad. La escala de Hombre produce una pun- 
tuacidn estindar similar a un Cl dc desviacidn, 
con media de 100 y desviacidn estindar de 15. 
La union prcocupaciun es que las normas son 
ahora bastante anticuadas. 

La confiabilidad dc la prueba sc ha evaluado 
a travds de procedimientos por mitades. estu- 
dios test-retest y comparaciones interculifi- 
cadorcs (Anastasi, 1975; Frederickson. 1985; 
Harris. 1963). Las conOabilidades por mitades 
cercanas a .90 son comuncs; no obstante, es 
poco frecuente que los coeficientcs de estabili- 
dad superen al rango de .70, incluso cuando el 
intcrvalo test-retest es s6lo de algunas sema- 
nas. Esto sugiere que las calificaciones en el 
test de Dibujo Goodcnough-Harris poseen una 
considerable banda de error de medicidn. Por 
otro lado, la calificacidn es bastante objetiva. 
Por lo comtin, las correlaciones intercalifica- 
dorcs se encuentran en el rango de .90. 

Los examinadores que han dominado el 
elaborado sistema de calificacidn por puntos 
pueden utilizar enlonces un mdtodo global mis 
•encillo denominado Escala de calidad. Esta es¬ 
cala consiste en 24 dibujos (12 para la escala de 
Hombre y 12 para la de Mujcr) utilizados como 
puntos estandarizados de referenda. El examina- 
dor compare los dibujos del individuo examinado 
con uno de los 12 dibujos dc referencia, des- 
!*•& consulta un cuadro para determinar la pun- 
<uaci6n estindar coirespondiente. La calificacidn 


de Calidad es mis ripida, pero un tanto mis 
rudimentaria: la confiabilidad intcrcalificadores 
suele colocarse por debajo del rango dc .80. 

Con frecucncia, el lest Goodcnough-Harris 
se utiliza como medida no verbal de la capaci- 
dad cognitiva con nifios que tienen trastornos 
del lenguaje, que pertenecen a minorfas o que 
son bilingUcs. Oakland y Dowling (1983) con- 
sideran que la prueba de dibujo tiene limitada 
influencia cultural apropiada para la deteccidn 
inicial con nifios de minorfas. La prueba fun- 
ciona mejor con nifios pcquefios, en particu¬ 
lar con aqucllos que tienen capacidad intelectual 
menor (Scott, 1981). Con muestras de nifios de 
cinco afios de edad en un centra de cuidado diur- 
no para familias de bajo nivel socioccondmico, 
Frederickson (1985) inform6 correlaciones en- 
tre el test de Dibujo Goodenough-Harris y el 
Cl Total del WPPSI en el rango de .72 a .80. 
En otros cstudios, las correlaciones con prue- 
bas individuals de Cl son mis variables, pero 
la mayor parte estin por encima de .50 (Abell, 
Bricsen y Watz, 1996; Anastasi, 1975). 

En respuesta a las criticas hacia el test de 
Dibujo Goodenough-Harris, Naglieri (1988) 
desarrolld un sistema de calificacidn cuantita- 
tiva y volvid a normar el procedimiento de di¬ 
bujo de la figure humana. Las normas de su 
sistema dc calificacidn, cl dibujo de la figure 
humana: un Sistema de Calificacidn Cuantita- 
tiva (DAP), se establecieron con una muestra 
de 2 622 individuos entre los 5 y 17 afios de 
edad, quienes eran representatives de los datos 
del censo de EUA para 1980 en cuanto a edad, 
sexo, raza, regidn geogrifica, gmpo itnico, cla- 
se social y tamafio dc la comunidad. El DAP 
produce puntuaciones estindar con la conoci- 
da media de 100 y dcsviacidn estindar de 15. 
En un estudiocon 61 personas entre 6 y 16 afios 
de edad, el DAP se correlaciond en .51 con el 
Cl del WISC-R y produjo calificaciones totalcs 
similares con un Cl medio de 100 contra una 
calificacidn media del DAP dc 95 (Wisniewski 
y Naglieri, 1989). Lassiter y Bardos (1995) en- 
contraron que la calificacidn de la DAP subes- 
tima las calificaciones de Cl obtenidas con el 
WPPSI-R y la K-BIT en una mucstra de 50 ni¬ 
fios de jardin de nifios y primer afio. 
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Quicncs han rescnado cl DAP lo alaban por 
su claro sistema de calificacidn. fucrte confia- 
bilidad y cuidadosa estandarizacidn (Cosden, 
1992). No obstante, los rcsultados de ios estudios 
de validez recomiendan mayor cautela. Harrison 
y Schock (1994) senalan que la evidcncia acu- 
mulada con las pruebas del dibujo de la figura 
humana (DFH) indica una validez predictiva 
de baja a moderada. A pesar de su popularidad 
y atractivo, las pruebas de DFH no idcntifican 
de manera eftcaz a los nifios con dificultadcs de 
aprendizaje o altcraciones del desarrollo y pue- 
den no scr vilidas incluso si se les utiliza como 
mcdidas de deteccidn. 


PRUEBA HISKEY-NEBRASKA DE APTTTUD 
PARA a APRENDIZAJE 


La Hiskey-Nebraska Test of Learning Aptitude 
(Prueba Hiskey-Nebraska de aptitud para el 
aprendizaje; H-NTLA) es una escala de ejecucidn 
que no requicre del lenguaje para utilizarse con 
nifios entre 3 y 17 afios de edad (Hiskey, 1966). 
Esta prueba puede aplicarse a travds de senas y 
no requiere respuesta verbal de parte de la per¬ 
sona cxaminada. Sin embargo, pueden emplear- 
se instrucciones verbales con ninos normales y 
con aquellos que tienen altcraciones auditivas 
leves. La H-NTLA consistc cn 12 subpruebas: 


Patrones de Cuentas 
Memoria para cl Color 
Idcntificacidn de 
Figuras 

Asociacidn de Figuras 

Doblado de Papel 
Nivel de Atcncidn 
Visual 


Patrones con Cubos 
Dibujos Incomplctos 
Memoria de Dfgitos 

Rompecabczas con 
Cubos 

Analogfas con Figuras 
Razonamiento Es- 
pacial 


Las puntuaciones naturales de las subpruebas 
se convierten en un Cociente dc Aprendizaje 
de Desviacidn (CA) con media de 100 y desvia- 
ci6n estandar de 16. Las calificaciones dc la 
H-NTLA se corrclacionan mucho con escalas de 
aprovechamiento desde segundo grade hasta 


bachillerato (mediana de r = .49) y tambidn con 
cl Cl dc Ejccucidn del W1SC-R (r = .85). Aim- 
que el CA rinde calificaciones promedio nota. 
blemente cercanas al Cl dc Ejecucidn del 
WISC-R para muestras dc nifios con alteracio- 
nes auditivas y sordos, las calificaciones de la 
H-NTLA son mucho mis variables (Watson y 
Goldgar, 1985; Phelps y Ensor, 1986). As(, l a 
utilizacidn de la H-NTLA puede aumentarel rics- 
go dc clasificacioncs cquivocadas por falsos 
positivos —etiquetar a los ninos como dotados 
cuando nada mis son inteligentes o con rctraso 
cuando s61o son limitrofes. 

La H-NTLA es adecuada para nifios sor¬ 
dos. con altcraciones dc habla o lenguaje, re- 
traso mental o bilingtles. Un aspecto interesantc 
de esta prueba es el desarrollo de normas pa- 
ralelas: la H-NTLA se estandarizd con 1 079 
nifios sordos y 1 074 nifios con audicidn nor¬ 
mal entre los 2 anos y medio y los 17 afios y 
medio. No obstante, la principal debilidad del 
instrumento es la deficiencia de estas normas. 
Por ejcmplo, en su mayorfa sc desconoce la 
representatividad de la mucstra de individuos 
sordos —elegidos dc manera oportunista dc una 
escuela para sordos. La cstandarizacidn de la 
muestra con audicidn normal se bas6 en el ni- 
vel ocupacional de los padres, segun cl ccnso 
de 1960 para EUA. Serfa bastante util una 
reestandarizaci6n contemporinea y mis deta- 
llada de la prueba. 


PRUEBA DE INTEUGENCIA 
NO VERBAL-3 

La prueba de inteligencia no verbal-3 (TONI-3) 
cs una medida dc la capacidad cognitiva que 
no requiere del lenguaje y que se disend para 
poblaciones discapacitadas o minoritarias 
(Brown, Sherbenou y Johnsen, 1998). En par¬ 
ticular, los autores recomiendan la prueba para 
la evaluacidn de personas con afasia, individuos 
que no hablan inglds, personas con alteracio- 
nes auditivas y para aquellos que han experi- 
mentado una variedad dc traumas neuroldgicoi 
graves. El examinador proporciona las instruc¬ 
ciones de la prueba con senas y el individuo 
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jgspomle senalando 1 de 4 o 6 posibles res- 
njestas. La prueba incluye dos formas equiva- 
| f nies con 50 reactivos dc solucidn de problemas 
ubsiractos/figurativos. fistos se sclcccionaron 
je inancra cuidadosa dc un conjunto inicial de 
ftaclivos segiin correlaciones reactivo-total, 
nivel apropiado de dificultad y accptabilidad para 
|o$ posibles usuarios y expertos t&nicos. Los 
[eiiciivos de la TONI-3 caen dentro de varias 
cjtegorfas, que incluyen las siguientes: 

• equiparacidn simple 

• analogfas 

• clasificacidn 

• interscccidn 

• progresiones 

Excepto por los de equiparacidn simple, los 
reactivos dc la TONI-3 requieren que la persona 
txaminada rcsuelva los problemas idenlificando 
las relaciones entre flguras abstractas. Muchos de 
los reactivos son similarcs cn formato a los en- 
contrados en Matrices Progresivas de Raven. 
La prueba produce dos tipos de puntuaciones: 
rangos percentiles y cocientcs de la TONI-3 
(media de 100 y dcsviacidn cstdndar de 15). 

La TONI-3 se estandarizd de manera cui¬ 
dadosa con mds dc 3 000 personas desdc los 6 
hasta los 89 ados. Las caractcrfsticas de la mues- 
tru son paralelas a los datos del censo en cuanto 
a sexo, raza, origen dtnico, residcncia urbana- 
suburbana-rural, grado cscolar. educaci6n/ocu- 
paci6n de los padres y regidn geogrdfica. Los 
datos de confiabilidad son bastante satisfacto- 
rios, con coeficientes de consistencia interna 
que suelen superar al .90 y confiabilidad de for¬ 
mas alternas en el range dc .80 a .95. 

Los estudios de validez de la TONI-3 son 
pocos, pero la investigacidn con ediciones an- 
teriorcs (que tienen un contenido muy similar) 
apoya a esta prueba como indice de la inteli- 
gencia general sin influencia de la cultura. No 
obstante, los resultados no rcspaldan la desig- 
Mcidn de la TONI-3 como una prueba no ver¬ 
bal, cxcepto cn el sentido trivial de que no se 
requieren respuestas vcrbales. Por cjemplo, cl 
Manual de la TONI-2 presenta coeficientes de 
<-'orrelaci6n en el rango de .70 entre las califi- 


caciones de esta prueba y la subprueba dc Ar- 
tes lingtlfsticas de la Serie de rendimiento SRA. 
En general, la investigacidn con las anteceso- 
ras de la TONI-3 indica que es una buena me- 
dida de la inteligencia general, pero no sustenta 
la perspcctiva de que es principalmente una 
medida de inteligencia no verbal (Murphy, 
1992). En general, la TONI-3 se considera, cn 
gran medida, como un inslrumento breve de de- 
tcccion que no emplca cl lenguaje y que es 
adccuada para personas con altcraciones en 
cuanto a sus capacidades lingtlfsticas (p. ej., 
personas que no hablan ingles, individuos con 
retraso mental, sordos o afdsicos). La prueba 
se estandarizd con mis cuidado que la mayor 
parte y posee excelente confiabilidad. Una ca- 
racterfstica util de la TONI-3 es que su aplica- 
cidn sin lfmite de tiempo pocas veces excede 
los 20 minutos. 

Dos instrumentos que sc analizaron antes 
en este texto tambidn pueden concebirse como 
pruebas que no requieren del lenguaje. Matri¬ 
ces Progresivas dc Raven y la Culture Fair 
Intelligence Test (Prueba de Inteligencia Cul- 
turalmente Justa) de Cattcll utilizan reactivos 
no vcrbales y no requieren en esencia dc inter- 
acciones basadas en cl lenguaje entre el exa- 
minador y la persona evaluada. Una prueba 
nueva y prometedora que noemplea el lenguaje 
es la Universal Nonverbal Intelligence Test 
(Prueba Universal de Inteligencia No Verbal; 
UNIT), una medida amplia y multidimensional 
dc la inteligencia no verbal (McCallum y 
Bracken, 1997; Reed y McCallum, 1995). Esta 
prueba se diseh6 para nifios que tienen deterio- 
ro auditivo o limitaciones cn sus habilidades en 
cl idioma inglds. La UNIT proporciona una bue¬ 
na medida dc g y varias subpuntuaciones que 
incluyen calificaciones claras, basadas en fac- 
tores, para memoria y razonamiento. 

m PRUEBAS QUE NO REQUIEREN 
■i LA LECTURA Y PRUEBAS CON 
REDUCabN MOTORA 

Como el lector recordard, las pruebas que no 
requieren lectura se disefiaron en EUA para 
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individuos iletrados que, sin embargo, pueden 
comprcnder el ingles hablado de manera sufi- 
cientcmente correcta como para scguir ins- 
Irucciones verbales. Las pruebas de inteligencia 
que no requieren lectura son adecuadas para 
ninos pcqucnos, personas iletradas e individuos 
con alteraciones del habla o el lenguaje expre- 
sivo; no necesitan ser especializadas o esotbri- 
cas; las subpruebas de ejccucibn de la mayor 
parte de los instrumentos convcncionalcs pue¬ 
den considerarse como pruebas que no re¬ 
quieren lectura. Por ejemplo, los examinado- 
res pueden utilizar las subpruebas de cjecucibn 
del W1SC-III para estimar la inteligencia de in¬ 
dividuos con alteraciones del lenguaje. 

No obstante, los pacientes con parblisis 
cerebral u otros padecimientos con alteraciones 
ortopbdicas tendrbn calificaciones muy bajas cn 
pruebas que no requieren lectura y necesitan 
respuestas de manipulacibn. La obtencibn de re- 
sultados vblidos de prueba con dichas personas 
puede presentar un reto enorme (ejemplo de 
caso 7-1). Los deficits motores, la mayor ten- 
dencia a la fatiga y la falta de cxactitud en los 
movimientos propositivos, comunes a las per¬ 
sonas con parblisis cerebral, afcctarbn de modo 
negativo su dcsempeno en las herramientas de 
evaluacibn cognitiva. Los clientes con impedi- 
mentos ortopbdicos necesitan pruebas que no 
requieran lectura y que tengan reduccibn mo- 
tora al mismo tiempo. En particular, las pruebas 
que permiten una respuesta simple de senaliza- 
ci6n son las mils adecuadas para la evaluacibn 
de ninos y adultos con parblisis cerebral y otros 
padecimientos que alteran la motricidad. 


PRUEBA PEABODY DE VOCABULARIO 
CON FIGURAS-III 

La Peabody Picture Vocabulary Test-Ill (Prue¬ 
ba Peabody de Vocabulario con Figuras-III, 
PPVT-III) es la mbs conocida y de uso mbs 
amplio entre las pruebas que no requieren lec¬ 
tura y tienen reduccibn motora (Dunn y Dunn, 
1998). La PPVT-III sc utiliza para obtener una 
medida rbpida del vocabulario con personas 
sordas, pacientes con alteraciones neurolbgi- 


cas e individuos con alteraciones del habla 
Aunquc la PPVT-III es util con cualquicr pc,, 
sona examinada que no pueda verbalizar bien 
la prueba es espccialmente util con individual 
que tambibn manifiestan trastomos que alteran 
la motricidad, como la parblisis cerebral o e ] 
evento vascular cerebral. 

La PPVT-III tiene dos formas paralelu 
cada una de las cuales consiste en 4 Idminasdc 
practica y 204 Ibminas de prueba. Cada ISmina 
conticne cuatro dibujos lineales de objetos o 
esccnas cotidianas. El examinador presentauna 
lamina, expresa la palabra verbalmente y le pide 
a la persona que sciialc el dibujo que mejor re 
presente la palabra expresada. Los reactivosde 
prueba se ordenaron segbn el nivel de dificul- 
tad, y se les clasificb en 17 conjuntos de 12 
reactivos cada uno para la identificaci6n eficaz 
de los nivelcs basal y superior. El nivel de cn- 
trada se determina de acuerdo con la edad, y la 
persona examinada continua hasta que f alia en 
varios reactivos consecutivos. Aunquc la prut 
ba no tiene Ifmite de tiempo, la aplicacibn po- 
cas vecesexcede IS minutos. Las puntuaciones 
naturales se convierten en cqui valcntes de edad 
o puntuaciones estbndar (media de 100, des- 
viacibn estbndar de 15). 

La PPVT-R se estandarizb con una niues- 
tra nacional representative de varios miles de 
individuos cuyas edadcs iban desde dos ados y 
medio hasta 90 anos o mbs. Con base en edi- 
ciones anteriores, los cocficientes de confia- 
bilidad por mitades son dbbiles en el caso de las 
personas mbs jbvenes (p. ej., .67 para el nivel 
de dos ados y medio), pero accptables para in¬ 
dividuos mayores (p. ej., .88 para el nivel de 18 
ados). Para la muestra adulta, la medians de los 
cocficientes de confiabilidad por mitades es .82. 
Las confiabilidades de formas altemas son bas- 
tante variables de una muestra a otra (valores 
de .50 a .90), pero tienden a agruparse alredc- 
dor de .80 (Bracken, Prasse y McCallum, 1984; 
Dunn y Dunn, 1981, Umberger, 1987). 

Varias lfneas de evidencia apoyan la vali- dez 
de la PPVT-R, pero sblo como una medida es- 
trecha del vocabulario, no como una medi- da 
general de la inteligencia (Alpeler, 1989; Alpcter 
y Johnson. 1989). Dunn y Dunn (1981) bus- 
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EjEMPLO DE CASO 7-1 

El R ETO DE LA EVAHJACltiN EN LA PARAllSiS CEREBRAL _ 

Los desaffos Inherentes a las consultas especiales se lipifican claramente en el caso de un 
clionle con accidente vascular cerebral al que un psicdlogo consullor sometki a prueba. El joven 
Indivlduo estaba conlinado de manera absolute a una silla de ruedas movilizada con baterfas, 
oxcepto cuando un ayudanle de planta lo iransfeda a una cama o silla. Incluso un observador 
Imparcial tendrla que eslar de acuerdo en que el cliente no parecfa muy capaz, senlado en su 
silla con una poslura encorvada, incapaz de controlar su salivackin exceslva, con un brazo doblado 
hacia aluera en un dngulo extrano. No obstante, a pesar de su discapacidad, habfa logrado un 
buen grado de independencia personal. Al utllizar un simple mecanismo de control de palanca, 
podia conduclr su silla hasta la tienda de abarrole9. biblioteca y cenlro comunitarfo, donde llevaba 
a cabo transacciones sencillas al senalar a las palabras y (rases apropiadas en un cuaderno 
de espiral (orrado de pldstico. Debldo a su pobre control motor, las inleraccfones con este cliente 
lomaban baslante liempo. Sin embargo, era muy eliclenle en las comunicaciones breves. 
£sle es un intercambio tfplco, donde en letras mayusculas se muestran las respuestas del 
cliente con su cuaderno. 

“Segun me informaron, usted tiene una nuevo aparato de comunicackSn que sintetiza la voz, 
iqu6 le parece?” ME HIZO DOS PREGUNTAS. “Clerto, apuesto que eso lo pasa muchas voces. 
^Tiene usted un aparato de comunicacldn?" Si’. “iQud piensa de 61?” NO ES FACIL. “Ahora que 
ya lerminamos con las pruebas, ^le busco a su ctiofer?" NO. ESPERO. £L VA A REGRESAR. 

£Qij 6 tan inteligente es este cliente? ^CuSI es su nivel de comprensibn verbal? iQud tan 
bien compronde los conceptos abstraclos? Por ejemplo, loa capaz de comprendar los aspeclos 
esenciales del uso de una microcomputadora como ingresar datos, guardar archivos y utilizar 
comandos dlrectivos? iPuede aprender a programar una microcomputadora? £stas son 
precisamenle las preguntas de canallzackJn que realizb un orlentador vocaclonal de rehabllitacldn 
que contemplaba la perspectiva de enormes gastos —miles de dblares— para comprar un sistema 
de cdmpulo para este cliente dlscapadtado. 

Con toda seguridad, serla Idcil subesllmar el polencial do este joven con graves dlscapa- 
cidades motoras y del lenguaje debido a que, en un sentldo muy literal —su intellgencla estaba 
oculta, atrapada en un cuerpo Incapacitado. La (area del examinador consislfa en encontrar la 
mente capaz dentro del cuerpo dlscapadtado, un reto que sin duda es formidable. Al utilizar el 
Test ol Nonverbal Intelligence-2 y la Peabody Picture Vocabulary Test-Revised, el examinador 
determine que este (oven diente posota cuando menos una Intellgonda promedio y que serfa 
muy probable que aprendiera los elementos fundamenlales del procesamiento de datos con una 
microcomputadora. 


caron gurantizar la validcz de contcnido al bus- 
car en el New Collegiate Dictionary dc Webster 
todas las palabras cuyos significados pudicran 
rcpresentarse a trav6s de un dibujo. Asf, los 
autorcs tenfan en mente un universo especifico 
de contcnido y los rcactivos de la PPVT-R pa- 
fccen conslituir un muestreo equitativo dc este 
dominio. Ademls, los autorcs utilizaron com- 
plejas tdcnicas de sclcccidn de rcactivos con 
base en cl modelo de rasgo latente de Rash- 


Wrighl, como una ayuda para darle validcz dc 
constructo a la prueba. Este modelo permite 
que los investigadores construyan una curva 
de crecimiento para el rasgo latente que mide la 
PPVT-R (vocabulario auditivo) y que seleccio- 
nen los rcactivos que m£s se acercan a la cur¬ 
va. Al utilizar datos de ensayo y calibracidn, se 
lraz6 la curva de manera repetida en una com- 
putadora. Si algun reactivo no se adaptaba al 
modelo de rasgo latente de Rasch-Wright (cur- 
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va reactivo-caracterfstica demasiado plana o 
inclinada), se le descartaba. 

Al utilizar un elaborado modelo de ccua- 
ci6n estructural, Miller y Lee (1993) demostra- 
ron que una edicidn anterior, la PPVT-R, refleja 
cl verdadero nivel dc desarrollo en cuanto a 
vocabulario. Estos invesligadores pudieron pre- 
decir razonablemente bien la clasificacidn de 
las palabras estimulo de la PPVT con base en las 
caractcrfsticas dc complcjidad dc la palabra 
(cronologfa de entrada en el idioma ingles, ex¬ 
tension de la palabra, numero dc significados 
diversos, frecuencia de ocurrencia). Las varia¬ 
bles predictivas proporcionaron unaexplicacidn 
tedrica razonable del orden de las palabras en 
la PPVT-R, es decir, confirmaron la validez de 
constructo de la prueba. 

Los datos sobre la validez concurrente y 
predictiva de la PPVT-R son un tanto limita- 
dos, pero prometedores. Varios invesligadores 
han correlacionado la PPVT-R con medidas de 
aprovechamiento, donde son comunes las rela- 
ciones bajas (r de .30 a .60). Las correlacio- 
ncs con el aprovechamiento en lectura tienden 
a ser mayores que con el aprovechamiento en 
ortograffa y aritmetica, lo cual sugicre que la 
PPVT-R tiene adecuada validez discriminativa 
(Vance, Kitson y Singer, 1985). 

Varios investigadores han correlacionado 
las versiones anteriores de la prueba con medi¬ 
das de inteligencia, en particular el WISC-R y 
el WAIS-R, donde la regia han sido las correla- 
ciones alias (cerca de .70) (p. ej.. Haddad, 1986; 
Naglieri y Yazzie, 1983). Como podrfa espe- 
rarse, las correlaciones tienden a ser mas alias 
con el Cl Verbal que con el de Ejecucidn. 

En un estudio muy importante e ingenioso. 
Maxwell y Wise (1984) investigaron la catga 
de vocabulario de la Peabody en una muestra 
de 84 pacientes intemos en pabellones de psi- 
quialrfa y psicologfa. Su estudio empled la 
PPVT, pero esta versidn anterior no revisada 
es tan similar a la PPVT-II1 que las conclusio- 
nes son pertinentes en este caso. Los investiga¬ 
dores estudiaron la hipdtesis de que la PPVT 
evaltia algo mds que el vocabulario en el caso 
de adultos. Ademds de esta prueba, los in¬ 
vestigadores obtuvieron datos del WAIS-R. la 
Escala Wechsler de memoria, velocidad de es- 


critura del nombre y arios de educacidn. La ve- 
locidad de escritura del nombre es simplcmen- 
te el numero de segundos requeridos para que 
la persona examinada escriba su propio nom¬ 
bre. Aurique todas las variables tuvieron co- 
rrclacioncs signiftcativas con el Cl de la PPVT, 
Vocabulario del WAIS-R tuvo, con mucho, la 
correlation mds alta (r = .88). Lo mds impor¬ 
tante es que cuando se elimind la varianza debi- 
da a Vocabulario, ninguna dc las variables 
restantes tuvo alguna relacidn predictiva con la 
PPVT. En pocas palabras, la Peabody es una 
buena medida dc vocabulario (en particular au- 
ditivo), pero puede ser engahosa si se le utiliza 
como una medida global del intelccto. 

La PPVT-III es una revisidn muy reciente. 
de modo que no existe investigacidn indepen- 
diente dc la prueba. Una advertencia con las 
ediciones previas es que las puntuaciones es- 
tdndar de la PPVT-R pueden sersustancialmente 
mds bajas que los Cl de Wechsler, en particular 
con personas que ticncn rctraso e individuos 
que pertenecen a minorfas. En una muestra de 
21 adultos con retraso mental leve, Prout y 
Schwartz (1984) encontraron que las puntua- 
cioncs estdndar de la PPVT-R (media de 56) 
eran, en promedio, 9 puntos menores que cl Cl 
del WAIS-R (media dc 65). Naglieri y Yazzie 
(1983) encontraron una enorme diferencia de 
26 puntos con una muestra de nifios indfgenas 
navajo que promediaron una puntuacidn es¬ 
tdndar de 61 en la PPVT-R, en contrastc con 
un Cl de 87 en el WISC-R. 

En general, se puede concluir que la PPVT-R 
es una medida del vocabulario auditivo que 
posee buenas normas y que es titil con perso¬ 
nas que tienen alteraciones motoras o que no 
saben leer. No obstante, el instrumento no cs 
sustituto de una prueba de la inteligencia ge¬ 
neral y de ediciones previas y puede sub- 
estimar en gran medida el funcionamiento 
intelectual de personas que pertenecen a mino¬ 
rfas o que tienen retraso mental. 

ESCALA COLUMBIA DE MADUREZ MENTAL 

La Columbia Menial Madurity Scale (Escala 
Columbia de madurez mental: CMMS) es una 
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prueba sin li'mitc de tiempo de la capacidad de 
riizonamiento, disenada para ninos pequefios 
con deficicncias scnsoriales, motoras o del ha- 
bla (Burgeraeister, Blum y Lorge, 1972). Esta 
prueba, quc ahora se encuentra en su lerccra 
cdicidn, sc dised6 originalmente para nidos 
pequefios con pardlisis cerebral. La CMMS ha 
cncontrado amplia aceptacidn con otras disca- 
pacidades, incluyendo sordera e impcdimentos 
del habla. El formato de la prueba cs claramen- 
le simple: de un grupo de 3, 4 o 5 dibujos, el 
nido tiene que "sedalar aquel que no pertenece 
a los demos’’. Asf, la CMMS no depende de las 
habilidades de lectura. Las normas de la prue¬ 
ba se establecieron para ninos de 3 ados y me¬ 
dio a 10 ados de edad. 

Las 92 Idminas de la CMMS examinan 
discriminacidn perceptual (p. ej., color, forma, 
tamano. uso, numero, partes faltantes), clasifi- 
caciones y manipulacidn abstracta de conceptos 
simbdlicos. La prueba requicre de 13 a 20 mi- 
nutos para su aplicacidn. Las punluaciones 
naturalcs se convierten en punluaciones de des- 
viacidn por edad con media de 100 y desvia- 
cidn cstilndar de 16. Tambidn se puede obtener 
una puntuacidn equivalente de edad llamada 
fndice de Madurez. En la figura 7-3 sc presen- 
tan varios reacti vos caracterfsticos de la CMMS. 



Nol«: Se Indlca a la persona evaluada que senate al reactlvo 
Que no pertenece a los demits. 


La muestra de estandarizacidn consiste en 
2 600 nidos sclcccionados de 23 estados, a fin 
de reproducir los datos del censo de 1960 
en cuanto a regidn geogrdfica, raza, ocupacidn 
de los padres, edad y sexo. La confiabilidad del 
instrumento es buena, con coeficientes test- 
retest y por mitades que se colocan en la parte 
superior del rango de .80. La validez concu- 
rrente del instrumento es adccuada: las corre- 
laciones con otros instrumentos sc encuentran 
por lo comun en el rango del .50. El Manual 
presenta una correlaci6n de .67 con la Stanford- 
Binet: Forma L-M. 

La CMMS tiene dos graves deficiencias. 
La primera es el hecho obvio de que las nor¬ 
mas, que se obtuvicron en el dccenio de 1960, son 
ahora extremadamente obsoletas. Con base en 
lo quc se ha observado con otras pruebas anli- 
cuadas, es probable quc la CMMS sobreestime 
el funcionamicnto de los ninos actuales (v6ase cl 
andlisis sobre el efecto Flynn en el siguiente 
tema). Otro problcma es que cuando la prueba 
se aplica a nidos muy pequefios, la escala es 
muy vulnerable a las conjeturas aleatorias. 
Kaufman (1978) senala que un nino pequedo 
que simplemcnte adivina obtendrd, en prome- 
dio, una puntuacidn de 82. Con un pocode suer- 
te en sus conjeturas, un nino de cinco ados de 
edad con retraso mental podria obtener una ca- 
lificacidn dentro del promedio. Asf, la CMMS 
tiene un valor limitado en la evaluacidn de nidos 
muy pequedos de los que se sospecha discapa- 
cidad intelectual. No obstante, las conjeturas 
tienen un efccto mfnimo en el caso de nidos ma- 
yores, debido al mayor numero de altemativas y 
a la mayor cantidad de reacti vos que suclen apli- 
carse. A pesar de estas limitacioncs, la CMMS 
es una medida util de la capacidad de razona- 
miento, que no requiere del lenguaje y que es 
adecuada para nidos en edad cscolar, pern los 
nuevos datos normativos son muy necesarios. 


HjPRUEBAS PARA INDMDUOS 
ig|CON ALTERACIONES VISUALES 




Rflura 7-3. Ejernplos de reactlvos caracteristicos de la 
CMMS. 


En la cvaluaci6n del fiincionamiento intelectual 
de personas con alteraciones visuales, los exa- 
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minadores han dcpendido histdricamenle de 
adaptaciones de la Stanford-Binet. La revi- si6n 
Hayes-Binet para el examen de individuos con 
alteraciones visualcs se bas6 en la Stanford- 
Binet de 1916; desde entonccs, este instrumento 
ha atravcsado por varias revisioncs. La adapta- 
ci6n mAs reciente es la Perkins-Binet (Davis, 
1980), que conserva la mayor parte de los 
reactivos verbales de la Stanford-Binet, pero 
tambien adapta otros a un modo tdctil. La 
Perkins-Binet posee una confiabilidad acepta- 
ble por mitades y muestra alias correlaciones 
con las cscalas verbales del WISC-R (Coveny, 
1972; Teare y Thompson, 1982). Los crcado- 
res de la Perkins-Binet han reconocido que 
los problemas visuales existcn cn un conti nuo 
y, por tanto, han desarrollado normas para ni- 
hos con visidn utilizable (Forma U) y no utili- 
zable (Forma N). 

Los creadores de pruebas tambien han te- 
nido dxito en modificar las Escalas de Ejecu- 
ci6n de Wechsler para utilizarlas con individuos 
que tienen alteraciones visuales. La Escala 
hAptica de intcligencia para adultos invidentes 
(del inglds Haptic Intelligence Scale for Adult 
Blind ; HISAB) consiste en seis subpruebas, 
cuatro de las cuales se asemejan a las de Sfm- 
bolos y Dfgitos, Discno con Cubos, Composi- 
cidn de Objetos y Figuras Incompletas de la 
Escala de Ejecucidn del WAIS (Shurranger, 
1961; Shurrager y Shurrager, 1964). Las otras 
dos subpruebas son Aritmdtica con Cuentas, 
que implica el uso dc un Abaco para resolver 
problemas aritmdticos, y Tablero de Patrones, 
que requiere que el examinado reproduzca el 
patr6n que ha sentido cn un tablero que ticnc 
filas dc orificios con clavijas en cllos. La 
confiabilidad dc la HISAB es excelente y los 
autores pro pore ionan datos normativos sobre 
una muestra dc adultos con discapacidad vi¬ 
sual. Lo mAs alentador es que las calificacio- 
nes de la HISAB se corrclacionan en .65 con cl 
Cl Verbal del WAIS (Shurrager y Shurrager, 
1964). 

Otro instrumento intcrcsante es la Blind 
Learning Aptitude Test (Prueba de aptitud para 
el aprendizaje para ciegos; BLAT). una prueba 
tActil para ninos invidentes de los 6 a 16 aflos 
de edad (Newland, 1971). Los reactivos de la 


BLAT se encuentran en forma de bajorrelieve 
que consiste cn puntos y rayas similarcs al sis. 
tema Braille. Los reactivos son de seis tipos 
diferentes: rcconocimiento de diferencias, re- 
conocimiento de semejanzas, identiftcaci6n dc 
progresiones, identificacidn del clemento 
faltante en una mairiz de 2 x 2, terminado de 
una figura incompleta e identificacidn del 
eleniento faltante en una matriz de 3 x 3. La 
mayor parte de los reactivos se adaptaron de 
Matrices Progresivas de Raven y de la Culture 
Fair Intelligence Test de Caltcll. La BLAT se 
estandarizd con 760 mhos con alteraciones vi¬ 
suales, pero las normas son anticuadas y el 
manual de la prueba es incomplcto y un tanto 
descuidado (Herman, 1988). No obstante, la 
prueba posee una confiabilidad excepcional y 
se correlaciona inuy bicn con la Hayes-Binet 
(r = .74) y con la Escala Verbal del W1SC 
(r = .71). En conjunto con una prueba verbal, 
la BLAT es un instrumento prometedor para 
probar la inteligcncia de ninos con discapa- 
cidadcs visuales. Sin embargo, la prueba se 
bcneficiarfa sustancialmcntc de rcvisioncs me- 
nores, actualizacidn de las normas y dc un ma¬ 
nual de prueba mils completo. 


EVALUACION DE LA CONDUCT* 
ADAPTAHVA EN EL RETRASO 
MENTAL 


La evaluaci6n del retraso mental es una pre- 
ocupacidn compleja y multifacdtica que, con 
todo derecho, mercce un capftulo o un libro 
aparte. Debido a las limitaciones dc cspacio, aqui 
se tratarii brevemente, y se referirA a los lecto- 
res interesados a los trabajos de la American 
Association on Mental Retardation (1992), 
Nihira (1985) y Saltier (1988, capftulos 15 y 21). 
Aquf se rcsumirAn en forma breve los criterios 
diagndsticos para el retraso mental y despuds 
se revisarAn, especfficamente, dos instruinen- 
tos contrastantes de evaluacidn. El texto tormi¬ 
na con un resumen tabular de varias medidas 
notables de la conducta adaptativa. 


I 
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P0|NIC|6n oe retraso mental 

ij fucnic con mayor autoridad para la defini- 


manu al define al retraso mental como sigue: 

Retraso mental se retiere a las limltaclones sus- 
lanctales en et (uncionamlento actual. Se carac- 
terlza por un funcionamiento Intelectual que se 
encuenlra de manera significative por debajo del 
promedio y que existe de modo concurrente con 
llmltaciones rolaclonadas en dos o mas de las 
slgulentes areas de habilldades adaptativas apil- 
cables: comunicacidn, autoculdado, vtda en el 
hogar, habilldades sociales, uso de la comuni- 
dad, Independence, salud y segurldad, conoci- 
mlentos acadomicos (uncionales, descanso y 
Irabajo. El retraso mental se manifiesta antes de 
los 18 artos de edad (AAMR, 1992). 

El Manual tambibn espccifica que cl funciona- 
miento intelectual que se encucntra de manera 
iignificativa por debajo del promedio es un Cl 
de 70 a 75, o menos, en esealas con una me¬ 
dia dc 100 y desviaciori estandar dc 15. En prue- 
bas como la Stanford-Binct: Cuarta Edicibn, 
que posec una dcsviacibn estandar de 16, el 
rango promedio de funcionamienlo intelectual 
deficicntc serfa un Cl de 68 a 73 o menor. El 
Manual tambibn afirma de modo explfcito la 
imponancia del juicio profesional en los casos 
individuates. 

Un Cl bajo no es, en sf mismo, un funda- 
mento suficiente para el diagnbstico de retraso 
mental. La definicibn de la AAMR tambibn 
especifica un segundo criterio, el de las limita- 
ciones en dos o mis dreas pertinentes de habi- 
lidad adaptativa. Un diagnbstico de retraso men¬ 
tal se justifica s6lo cuando un individuo pre- 
senta un Cl suficientcmente bajo y limitaciones 
cn habilidades de adaptacibn. Ademds, cstas 
deftciencias en intelecto y en funcionamienlo 
adaptativo deben haber surgido durante el pe- 
riodo del desarrollo —definido como aqubl en- 
be el nacimiento y los 18 anos de edad. 

Este Manual mbs reciente de la AAMR 
itpresenta un distanciamiento con respecto a 
la terminologta anterior que reconocfa cuatro 
niveles de retraso: levc, modcrado, grave y pro- 


cidn de retraso mental es el manual de termino¬ 
logy y clasificacibn de la American Association 
n Mental Retardation (AAMR, 1992). Este 


fundo. En vez de enfocarse en las deficiencias 
dc la persona, el Manual introduce una jerar- 
qufa de “Intensidades de los apoyos reque- 
ridos”, que redirige la atencibn hacia las 
necesidades de rehabilitacibn del cliente. Los 
cuatro niveles de apoyo requerido son: intermi- 
(ente, limitado, extenso y general izado. No obs¬ 
tante, es probable que la terminologfa anterior 
referente a los niveles de retraso se conserve 
por bastante tiempo, dc modo que en el cuadro 
7-1 se ha elegido una mezcla del viejo enfoque 
con el nuevo. El lector observarb que existe una 
zona dc inccrtidumbrc cnlre los niveles de retra¬ 
so, lo que significa que se requiere del juicio 
clfnico acerca de todas las fuentes de informa- 
ci6n para elaborar el diagn6stico. Lo que cs mds, 


Cuadro 7-1. Cuatro niveles de retraso 
mental 


Retraso mental leve: Cl de 50 a 55 y de 70 a 75-*-, 
se requiere apoyo intermitente. Habilidades 
sociales y de comunicacidn razonables; con 
educacibn especial, puede lograr un nivel de sexto 
grado para finales de la adolescencia; alcanza un 
nivel social y vocacional adecuados con entre- 
namiento especial y supervision; independence 
parcial en disposiciones de vivienda. 

Retraso mental moderado: Cl de 35 a 44 a 50 a 
55, se requiere apoyo limitado. Habilidades 
sociales y de comunicacidn adecuadas, pero poca 
conciencia de sf mismo; con educacibn especial 
ampliada logra un nivel de cuarto grado; funcio- 
na en un taller protegido, pero necesita supervision 
en lets disposiciones de vivienda. 

Retraso mental grave: Cl de 20 a 25 a 35 a 40, 
se requiere apoyo profuso. Pocas o ninguna ha- 
bilidad de comunicacidn; alteraciones sensoriales 
y motoras; no se beneficia del entrenamiento 
acaddmico; entrenable en hbbitos bbsicos de 
salud. 

Retraso mental profundo: Cl inferior a 20 a 25, 
se requiere apoyo generalizado. Funcionamienlo 
mi'nimo; incapaz de cuidar de si mismo; necesita 
constants atencibn y supervisibn profesionales. 

Fuonle: Basado en AAMR (1992) y Patton, Payne y Beirne-Smith 
(1986), 
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aunque estos nivcles se calibran por medio dc 
los rangos de Cl, se recordarA al lector que la 
persona evaluada tambiAn debc mostrar un de¬ 
ficit correspondiente en dos o mils Areas de ha- 
bilidad adaptativa. Bajo ninguna circunstancia 
una prueba de Cl es base suficiente para el diag- 
ndstico de retraso mental. 

Las limitaciones en habilidadcs adaptau vas 
son mAs diffeiles de confirmar que un Cl bajo. 
El Manual de la AAMR lista 10 Areas diferen- 
tes de habilidad adaptativa y especifica que el 
cliente debc mostrar limitaciones sustanciales 
en dos o mAs de ellas: 

• comunicacidn 

• autocuidado 

• vida en cl hogar 

• habilidades socialcs 

• uso de la comunidad 

• independcncia 

• salud y seguridad 

• conocimientos acaddmicos funcionales 

• descanso 

• trabajo 

En cuanto a la manera en que han de evaluarse 
estas limitaciones. el Manual propone que son 
dcseables las medidas bien normadas de las habi¬ 
lidadcs adaptativas, pero la determinacidn final 
siempre es una cuestidn de juicio profcsional. 

Un autor de pruebas enfrenta importantes 
problemas para medir las limitaciones en con- 
ducta adaptativa. Casi el linico hecho sdlido que 
se tiene cn cste campo es que las expectativas 
ambicntales hacia la conducta adaptativa au- 
mentan de manera pronunciada desde cl naci- 
miento hasta la adultez joven. AdemAs, la 
expresidn de la conducta adaptativa cambia de 
carActer a lo largo de estc periodo. En la infan- 
cia, las conductas adaptativas pueden reflejar- 
se en las habilidades sensoriomotoras y en la 
facilidad para cl lenguaje. En la adultez, los 
logros vocacionales y la responsabilidad social 
se vuelven importantes. Igual que ocurre con 
la evaluacidn intclcctual. las herramientas para 
valorar la conducta adaptativa deben cstar cui- 
dadosamente graduadas de acucrdo con la edad. 


El primer instrumento cstandarizado par a 
evaluar la conducta adaptativa fue la Vineland 
Social Maturity Scale (Escala Vineland dc 
Madurez Social; Doll, 1935, 1936). Un tanto 
simplista y cruda para las normas modemas, | a 
escala Vineland original consistfa en 117 reac- 
tivos separados ordenados en un fonnato de 
escala por afios dc edad. Un informante fami- 
liarizado con la persona examinada marcaba los 
reactivos aplicables. A partir de estos resulta- 
dos, el examinadorcalculaba un equivalcntedc 
edad social, util en el diagndstico dc retraso 
mental. Esta escala todavfa es un instrumento 
respetado que ha atravesado por varias revisions 
y ahora se conoce como Vineland Adaptativt 
Behavior Scales (Escalas Vineland de Conducta 
Adaptativa; Sparrow, Balia y Ciccetti, 1984). 

Desde la aparicidn de la Escala Vineland 
original sc han publicado mAs de 100 escalas 
de conducta adaptativa (Nihira, 1985; Reschly, 
1990; Walls, Werner. Bacon y Zane, 1977), 
Estos instrumentos varfan en gran medida en 
cuanto a cstructura, propdsito y poblacidn bian¬ 
co. En tdrminos gcnerales, se pueden distinguir 
dos tipos de instrumentos disefiados para dos 
propdsitos diferentes. Un grupo lo integran prin- 
cipalmente las escalas referidas a normas que 
se utilizan en general para asistiren cl diagnAs- 
tico y clasificacidn. Otro grupo estA formado 
por escalas referidas a crilerio y sc utiliza de ma¬ 
nera principal para asistiren el entrenamientoy 
la rehabilitacidn. Se ha elegido un instrumento 
representative de cada grupo para realizar un 
anAlisis mAs detallado. 


ESCALAS DE CONDUCTA 
INDEPENDIENTE-REVISADAS 

Las Escalas dc Conducta Independicnte-Revi- 
sadas (SIB-R; del inglds Scales of Independent 
Behavior-Revised', Bruininks, Woodcock, 
Weatherman y Hill, 1996) son una ambiciosa 
medida multidimensional de la conducta adap¬ 
tativa que es de suma utilidad para la evalua- 
ci6n del retraso mental. El instrumentoconsistf 
en 259 reactivos dc conducta adaptativa que se 
organizaron en 14 subescalas. La escala secom- 
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pleta con la ayuda de un padre, maestro o en- 
cargado del cuidado del paciente que este bien 
familiarizado con las conductas cotidianas de 
la persona examinada. Para cada subescala, el 
examinador lee una serie de reactivos y para 
cada uno registra una calificacidn de 0 (nunca 
ocasi nunca realiza la tarca) a 3 (realiza muy 
bien la tarea). Una caracteristica util de la SIB-R 
es que cl examinador necesita un entrcnamien- 
lo y experiencia minimos. Por supuesto, se re¬ 
quire un ni vel mucho mds alto de competencia 
para evaluar los resultados y tomar dccisiones 
sobre asignacidn o tratamiento. 

Las 14 subescalas de la SIB est£n ordcna- 
das en cuatro agrupamicntos, como se describe 
en el cuadro 7-2. A su vez, estos cuatro agru- 
pamientos constituyen la Escala de Independen- 
cia General. Cada subescala incluye un pequcho 
numero de reactivos separados, ordenados con 
base en el desarrollo. Por ejemplo, la subescala 
de Alimcntacidn y Preparacidn de Comidas tie- 
ne 19 reactivos por grados, que incluycn: en- 
sarta la came con un tcncdor, come la sopa con 
cuchara, (oma porcioncs dc tamano apropiado 
y prepara bocadillos que no requicien cocinarse. 
Para cada subescala, los reactivos se aplican hasta 
llegar a un dcterminado nivel superior (p. ej.. 3 
a 5 reactivos consccutivos calificados con 0). 

Las puntuaciones naturales de cada sub- 
ptueba se suman para obtener una calificacidn 
parcial. Despuds se suman las calificaciones 
parcialcs de cada agrupamicnto para obtener 
una calificacidn por agrupamiento. La puntua- 
cidn de la Escala de Independencia General se 
deriva del promedio dc las cuatro calificacio¬ 
nes de agrupamicnto. Las calificaciones dc 
subprueba, agrupamiento e Independencia Ge¬ 
neral pueden convertirse despuds en una varie- 
dad de calificaciones normativas que permitcn 
la comparacidn del desempeno del examinado 
con el de una muestra normativa nacional. Las 
escalas normativas incluyen: calificaciones por 
edad, rangos percentiles, puntuaciones estdndar, 
estaninas y equivalcntes de curva normal. 

Una parte autdnoma y unica de la SIB-R 
lambidn evalua la conducta desadaptativa al 
medir la frccuencia y gravedad dc las conduc¬ 
es problems. La Escala de Conductas Proble¬ 


ms incluye ocho catcgorfas principals de 
desadaptacidn personal y social que pucdcn 
afectar la conducta adaptativa: Danos contra sf 
mismo, Danos contra los demds, Destruccidn 
de la propicdad, Conducta indisciplinada, Ha- 
bitos inusualcs y rcpctitivos, Conducta social- 
mente ofensiva, Conducta dc retraimicnto o 
falta de atencidn y Conducta no coopcrativa. 
Se proporcionan listas de conductas problems 
y la persona que respondc debc indicar las con¬ 
ductas exhibidas por el individuo evaluado. 
Adcm<1s, quien responde a la escala describe la 
conducta m£s grave en cada categorfa y la cali- 
fica segiin la frccuencia de ocurrencia, grave- 
dad y manejo tfpico. 

La estandarizacidn de la SIB-R sc conci- 
bi6 y ejecuto de manera adecuada. La muestra 
normativa incluyd a 2 182 personas en una mucs- 
tra que reflcja las caractcrfsticas del censo dc 
1990. Los datos normativos abarcan personas 
desde los 3 meses hasta adultos dc mds dc 80 
aiios dc edad. Tambien se sometid a pmeba a 
una muestra adicional de mds de I 000 indivi- 
duos con retraso mental, discapacidades para 
el aprendizaje, trastomos dc conducta y alte- 
raciones auditivas. El valor de la SIB-R se forta- 
Iccid aun mds al vincular dichas escalas con las 
normas dc la Bateria Psicoeducativa Woodcock- 
Johnson-Revisada. La SIB-R es un componen- 
(e de esta bateria mds amplia, pero se le puede 
utilizar dc manera independiente. 

La confiabilidad dc la SIB-R se considera 
respetable en tdrminos gcncrales, pero es va¬ 
riable de una subescala a otra y de un grupo de 
edad a otro. Las subescalas individuales tien- 
den a mostrar confiabilidades por mitades cer- 
canas a 0.80; los cuatro agrupamicntos ticnen 
confiabilidades mixtas medianas alredcdor de 
.90; la Escala de Independencia General ticnc 
una confiabilidad muy fuerte de .90 (Bruininks, 
Woodcock, Weatherman y Hill, 1996). 

Los datos iniciales de validez para la SIB-R 
son muy prometedores. Por ejemplo, las califi¬ 
caciones medias para diversas muestras de per¬ 
sonas con discapacidad y sin ella muestran 
relacioncs confirmatorias: las puntuaciones dc la 
SIB-R son m4s bajas entre aqucllos individuos 
dc los que sc sabe que tienen la discapacidad 
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Cuadro 7-2. Subescalas y Agrupamientos de las 
Escalas de Conducta Independente-Revisada 


1. Habilldades motoras 

Motoras gruesas: 19 habilldades de musculos grandes, como sentarse sin apoyo o lomar parte en 
actividades flsicas vigorosas. 

Motoras finas: 19 habilldades de musculos pequenos, como levantar objetos pequenos o nrmarlos. 

2. Habilldades sociales y de comunicacibn 

Inte r acci6n social: 18 habilldades que requieren Interacclbn con otras personas, como pasar juguetes 
a otros individuos o hacer planes con amigos para asistir a actividades sociales. 

Comprensibn del lenguaje: 18 habilidades que implican la comprensibn de lenguaje hablado o escrito, 
como dirigir la mirada hacia el hablante o leer. 

Expresidn del lenguaje: 20 habilidades que implican hablar, como hacer sonidos para obtener atencibn 
o explicar un conlrato por escrito. 

3. Habilidades de la vida personal 

Alimentatibn y preparacion de comida: 19 habilidades relacionadas con la allmentacibn y preparacibn 
de comidas, que van desde beber en un vaso hasta planear una comida. 

Control de eslinteres: 17 habilidades necesarias para uso del bario y retrete. 

Vestido: 18 habilidades relacionadas con vestirse, que van desde levantar los brazos y piernas mientras 
se le viste hasta hacer arreglos para allerar la ropa. 

Autocuidado personal: 16 tareas que se relacionan con el arreglo personal bAsico y la conservacibn 
de la salud; por ejemplo, lavarse las manos y hacer una cita con el mbdico. 

Habilidades dombsticas: 18 tareas necesarias para mantener en orden una casa, que van desde 
colocar los platos vacios en el fregadero, hasta seleccionar una vivienda apropiada. 

4. Habilidades de la vida en comunidad 

Tiempo y puntualidad: 19 tareas que implican conceptos de tiempo y manejo del mismo, como cumpllr 
con una cita. 

Oinero y valores: 20 habilidades relacionadas con conceptos de dinero, como ahorro de dinero y uso 
de crddito. 

Habilldades laborales: 20 habilidades relacionadas con hbbitos prevocacionales y laborales; por 
ejemplo, indicar que se ha terminado con una (area asignada. 

Orientacibn en hogar y comunidad: 18 habilidades implicadas en desplazarse dentro del hogar y 
vecindario y trasladarse dentro de la comunidad; por ejemplo, localizar a un dentista. 


mbs grave en aprendizaje y adaptacibn. Para los 
individuos discapacitados, las puntuacioncs de la 
SIB-R se corrclacionan en gran medida con cali- 
ficaciones de intcligencia (.80), mientras que en 
el caso de individuos examinados que no tienen 
discapacidad la rclacibn es minima (Bmininks, 
Woodcock, Weatherman y Hill, 1996). 

En resumcn, la SIB-R es una excelente 
herramienla para proporcionar discemimientos 
acerca del nivel actual de funcionamiento de la 
persona en situaciones reales en el hogar, es- 
cucla y cntornos comunitarios. Aunque este 
instrumento no tiene una correspondencia uno 


a uno con las 10 Areas de habilidad adaptativa 
listadas en la definicibn de retraso mental, existe 
una semcjanza sustancial. Por ejemplo, las si- 
guicntcs Areas de las habilidades adaptativas 
listadas por la AAMR se cubren de manera ade- 
cuada en las subescalas o agrupamientos de la 
SIB-R: comunicacibn. autocuidado, vida en el 
hogar, habilidades sociales, uso de la comunidad, 
salud y scguridad. y trabajo. La SIB-R o un ins¬ 
trumento similar se clasifica como complemcn- 
to obligatorio de las pruebas individuates dc 
inteligencia en el diagnbstico y evaluacibn del 
retraso mental. 


I 
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usta de verificacjon de la conducta 

de VIDA INDEPENDIENTE (ILBQ 

U Independent Living Behavior Checklist (Lis- 
u de Verificacibn de la Conducta de Vida In- 
dependiente; ILBC) es una extensa lista de 343 
liabilidades de vida independicnte, clasificadas 
y presentadas cn seis catcgorfas: movilidad, 
autocuidado. mantenimicnto y seguridad del 
hogar, alimcntacibn, social y comunicacibn y 
■cadlmica funcional (Walls, Zane y Thvedt, 
1979). A diferencia de la mayor parte de los 
instrumcntos analizados hasta ahora en este tex- 
io, la ILBC carece por completo de relacibn con 
normas. El irnico propbsito de esta prueba es 
facilitar el cntrcnamicnto del individuo exami- 
nado cn las habilidades rcqueridas para la vida 
independicnte. Para este prop6sito, un conjunto 
de habilidades cuidadosamente seleccionadas 
referida.: a critcrio funciona mejorque un grupo 
decalificaciones con base en normas. La ILBC se 
cnfoca en aquello que la persona pucdc hacer, 
nocn cbmo se compara dicha persona con otras. 


No se especifica un rango cxacto dc cdad, pero 
el instrumento parece adecuado para individuos 
desde los 16 aiios hasta la edad adulta. 

Para cada habilidad, la ILBC especifica una 
condicibn, una conducta y un cstbndar. El cua- 
dro 7-3 lista una mucstra dc reactivos dc la 
ILBC. El lector observara que los tres compo- 
nentes (condicibn, conducta y estbndar) se de- 
tinen con la suficicntc prccisibn como para que 
sea posible que observadores razonables coin- 
cidan acerca dc cubndo se ha dominado una 
habilidad. De hecho, la confiabilidad test-retest 
y la concordancia entre observadores para las 
habilidades de la ILBC van de .96 a un perfec- 
to LOO. 

Los reactivos dentro de cada catcgorfa dc 
la ILBC se seleccionaron con cuidado para en- 
globar las habilidades imporlantes y pertinentes 
para la vida independicnte. En aparicncia, los 
autores tuvicron dxito en identificar las habili¬ 
dades esenciales, dado que su instrumento tie- 
ne una superposicibn de 100% con otra lista de 
verificaci6n dc la vida independicnte, inicialmcnte 


Cuadro 7-3. Muestra de reactivos de la ILBC 


Espbtula de plastico 35 

Condicibn: Dar un lazdn que contiene ingredientes, una cacerola y una esphtula de plbstico. 
Conducta: El clienle vierte los ingredientes en la cacerola y raspa los lados del tazbn con la espblula. 

Estandar: Conducta denlro de un periodo de dos minutos. No deben derramarse los ingredientes. 
Todos deben retirarse del tazbn. 

Eloglos 30 

Condicibn: Oar un role playo situacibn natural en la que se elogia al clienle. 

Conducta: El cliente acepta el(los) elogio(s) (p. ej., dice "Gracias"). 

Estbndar; En el rote play o situacibn natural, todas las personas entrevlstadas deben expresar de manera 
indopendiente que el clienle aceptb el elogio de manera amable y no fue demasiado cortbs o vanidoso. 

Direcciones 38 

Condlclbn: Dar un trozo de papel con la direccibn de un lugar locallzado denlro de una distancia de 

Ires cuadras con respecto al cliente. 

Conducta: El cliente encuentra el lugar apropiado con o sin ayuda. 

Eslbndar: Conducta en un periodo de una hora. Se debe encontrar el lugar apropiado. El cliente 
Puode encontrar el lugar por s( solo o con ayuda (p. ej., pidiendo indicaciones a otras personas, como 
un poliefa). 


Reproducldo con autoruaodn de Walls, R T., Zane, T y Thvedl, J E (1979) The Independent Living Behavior Checklist 
ftmbar, WV Wasl Virginia Research and Training Center 
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desconocida (Schwab, 1979). Ademtis, los 
reactivos de la ILBC se ordenaron cuidado- 
samcnte del mis fticil al mtis diffcil. Cuando 
se le utiliza dc mancra continua a lo largo de 
un pcriodo de entrenamicnto dc varios aims, la 
ILBC proporciona. al mismo liempo, una lista 
de verificacidn para las habilidades dominadas 
y una gufa para mayor rehabilitacidn. 

MEDIDAS AOICIONALES DE LA 
CONDUCTA ADAPTATIVA 

Se recuerda al lector que las medidas de con- 
ducta adaptativa varian en gran medida. Algu- 


nas escalas esltin discnadas principalmente pa rj 
el diagndstico y otras para la rehabilitacitin; *|. 
gunas son tidies con personas que tienen rctr*. 
so mental grave y profundo y que nunc* 
obtcndrtin un empleo; otras son adecuadas par* 
individuos con retraso mental leve que buscan 
entrenamiento vocacional. Algunas escalas son 
tidies exclusi vamente con ninos, otras, con adui- 
tos. Estos instrumentos no son intcrcambiables 
y el usuario potential debe cstudiar con cuida- 
do sus fortalezas y limitaciones. En el cuadro 
7-4 se ha resumido 1 o 2 caracterfsticas sobre- 
salientes de varias de las medidas mtis conoci- 
das de conducta adaptativa. Reschly (1990) 
revisa otras escalas adicionales. 


Cuadro 7-4. Medidas de conducta adaptativa 


Adaptive Behavior Inventory tor Children 
(Inventarlo de Conducta Adaptativa para Ninos; ABIC) 

Edades 5-0 a 11-11 anos 

La ABIC es parte del sistema de evaluacidn multicultural pluralista (SOMPA). Seis tireas de conducta 
adaptativa miden conducta de rol en el hogar, vecindario y comunidad. Sattler (1988) advierte que la 
ABIC no hace ninguna dispostcion en cuanto a considerar las oportunldades del nino para aprender las 
conductas adaptalivas. 

Mercer y Lewis (1978) 

AAMR Adaptive Behavior Scales —Residential and Community, 2nd Edition 
(Escalas de Conducta Adaptativa AAMR —Residencial y Comunitaria, 2a Edicidn; ABS-RC:2) 

Edades de 18-0 hasta 80-0 

Este instrumento es una proeza psicometrica que raya en la exageracidn. La muestra normative 
incluye a mtis de 4 000 personas con discapacidades del desarrollo, que provienen de 43 estados y 
residen en entornos comunitarios o residenciales. Las conflabilidades de conslstencla interna y de 
test-retest superan al .80 en todas las calificaclones de dominio. El instrumento se ha validado de 
manera extensa y distingue con claridad a las personas clasificadas de manera independiente en 
diferentes niveles de conducta adaptativa. 

Nihira, Leland y Lambert (1993) 

AAMR Adaptive Behavior Scales — School, 2nd Edition 
(Escalas de Conducta Adaptativa AAMR —Version escolar, 2a Edicidn; AAMR —ABS) 

Edades de 3-0 a 18-11 aftos 

Este instrumento es util con preescolares y ninos en edad escolar de los que existe la sospecha do 
retraso mental. Uno de los padres o el encargado del cuidado del nino es quien llena la escala. La 
escala escolar AAMR actual se divide en dos paries. La primera consta de nueve dominios conducluales 
que tienen que ver con independencia personal. La segunda parte se enfoca en la valoracidn de conductaa 
sodalmente desadaptativas. La escala produce cinco puntuaciones factoriales al igual que una puntuacidn 
total de independencia. 

Lambert, Nihira y Leland (1993) 
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Cuadro 7-4. Medidas de conducta adaptativa (continuacion) 


Vineland Adaptive Behavior Scales 
(Escalas Vineland de conducta adaptativa; VABS) 

Edades desde el nacimiento hasta los 19*11 anos. 

La VABS es un instrumento sumamente respetado que liene buena valldez concurrenle; as( como 
jocrelaclones de .50 a .80 con el WISC-R y la Stanford-Binet. No obstante, algunos roactivos requieren 
conoclmlento que es posible que los intormantes no conozcan (p. ej„ si el nino dice 100 palabras 
fgconocibles). Sllverstein (1986) crilica los datos normativos, senalando sallos disconllnuos en 
punluaciones eslAndar de un grupo de edad a olro. 

Sparrow. Balia y Cicchetti (1984) 


TMR School Competency Scales 

_ (Escalas de aptitud escolar para D ME; retraso mental entrenable) 

Dos formas: edades 5 a 10*11 anos y 11 anos en adelante. 

Disenada para evaluar las habilidades sociales y personates de ninos con retraso mental entrenable en 
unambiente escolar. Las cinco escalas induyen Perceptomotora, Iniciativa-responsabllidad, Cognicidn, 
Personal-social y Lenguaje. El maestro elige enlre cuatro niveles de aptitud para cada reactivo. En la 
actualidad faltan datos de validez. 

Levine, Elzey, Thormahlen y Cain (1976) 

Balthazar Scales of Adaptive Behavior 
(Escalas Balthazar de conducta adaptativa) 

Edades 5 anos hasta la adultez 

Un instrumento util para evaluar la eficacia de programas de entrenamlento con individuos que lienen 
retraso mental grave y profundo. Las Escalas Balthazar proporcionan un andlisis detallado de las 
conductas de alimentacidn, vestido y entrenamienlo de esffnteres. 

Camelot Behavioral Checklist 

__ (Lista de verificacidn conductual Camelot) 

Adultos 

La Camelot consta de 399 descripciones conductuales agrupadas en 40 subdominios y 10 dominios. 
Ejemplos de reactivos incluyen "vierte llquidos", "encera pisos", “puede hervir comida” y “puede realizar 
trabajos de engrapado". Las 10 calilicaciones de dominio producen percentiles referidos a la norma 
basados en una mueslra de 624 personas con discapacidad del desarrollo. La Camelot tiene excelente 
conliabilidad y se correlaciona de .70 a ,86 con las pruebas Wechsler y la Stanlord-Binel. 

Bruininks-Oseretsky Test of Motor Proficiency 
L_ (Prueba de destreza moto ra Bruininks-Oseretsky) 

Edades 4-6 a 14-6 aftos — 

Eda prueba especializada se desarrolld para ayudar a educadores y dlnicos a identilicar y evaluar 
dWunciones motoras en personas que tienen retraso mental u otras dificullades del desarrollo. Ocho 
•ubpruebas examinan la veloddad y agilidad para correr, equilibrio, coordinacidn bilateral, lortaleza. 
wofcfinacidn de miembros superiores, velocidad de respuesta, control visomotor, y veloddad y destreza 
tr ' miembros superiores. 

Brulnlnks (1978) 
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1. En el decenio de 1970, la renovada preocu- 
pacidn de la sociedad accrca de las ncce- 
sidadcs de las personas con discapacida- 
des sc tradujocn legislacidn federal. La Ley 
Piiblica 93-112 prohibid la discriminacidn 
basada en la discapacidad. La Ley Publica 
94-142 decreed que los nifios discapacilados 
en edad escolar recibicran una evaluacidn 
apropiada y oportunidades educativas. 

2. La Ley Publica 94-142, Decreto de educa- 
cidn para todos los nifios con discapacidad, 
ha tenido impactos sobresalientes en las 
pr&cticas de evaluacidn de los individuos 
con discapacidad. La ley especifica: eva¬ 
luacidn no discriminatory, examen cfectua- 
doen la lengua matema, empleo de pruebas 
vAlidas aplicadas por personal con el entre- 
namiento apropiado y uso de procedimicn- 
tos auxiliarcs; por ejcmplo, evaluacidn de 
salud, audicidn, visidn y estado emocional. 

3. La Ley Publica 99-457 requiere que los es- 
tados proporcionen educacidn publica apro¬ 
piada y gratuita a nifios entre los 3 y 5 afios 
de edad que sufran discapacidades. Ade¬ 
nitis, la ley decrcla subsidios ccondmicos 
para los estados que atiendan las necesida- 
des de los lactantes e infantes discapacilados 
y de sus familias. 

4. El Decreto sobre los estadounidenses con 
discapacidades (ADA) de 1990 ordena que 
las instituciones deben hacer arreglos razo- 
nables a la prueba para las personas con dis¬ 
capacidad. incluyendo disposiciones como 
aumento en el tiempo para pruebas con If- 
mites de tiempo en el caso de personas con 
discapacidad para el aprendizaje o trastor- 
nos relacionados. 

5. La Leiter International Performance Scale- 
Revised es una medida sin lfmite de tiempo 
de la organizaci6n perceptual y de la capa- 
cidad de razonamiento. La prueba puede 
aplicarse completamenlc a travds de sefias 
—cl examinando compara pequenas tarje- 


las laminadas debajo de las ilustracioncs co- 
rrespondienles cn un folleto colocado en 
forma de atril. 

6. El Test de Dibujo Goodenough-Harris es 
una prueba breve de deteccidn de la intcli- 
gencia en la que se anima a la person# 
evaluada a hacer un buen dibujo de un horn- 
bre. Los 73 elementos a calificar incluyen 
partes de cuerpo, dclalles, perspectiva, pro- 
porcidn c implicacidn de libcrtad de movi- 
miento. El Test del Dibujo de la Figura 
Humana de Naglieri (1988) es una versifa 
actualizada de la Prueba de Dibujo. 

7. La Hiskey-Nebraska Test of Learning 
Aptitude es una escala de ejccucidn que no 
requiere del lenguaje y que se utiliza con 
nifios entre los 3 y 17 afios de edad. La prue¬ 
ba se emplea con nifios sondos, con altcra- 
ciones del habla o lenguaje, relraso mental 
o bilingUes. Sus normas se establecieron ori- 
ginalmcntc en 1960 y, por tanto, la prueba 
requiere reestandarizacidn. 

8. El Test de Intcligencia no Vcrbal-3 (TONI-3) 
es una medida no verbal, de opcidn multi¬ 
ple. de la capacidad cognitiva, que se diseM 
para poblacioncs especialcs y se esianda* 
riz6 cuidadosamente para edades desde 
los 5 hasta 85 afios. La mayor parte de los 
reactivos requiere que el individuo evalua- 
do idcntifique las relaciones entre figures 
abstractas. La TONI-3 es un buen fndicede 
la inteligencia general —al contrario de In 
no verbal. 

9. La Peabody Picture Vocabulary Test-Ill 
(PPVT-III) es adecuada para obtener una 
medida rdpida del vocabulario auditivocon 
personas sordas o discapacitadas (p. ej.. por 
evento vascular cerebral o pardlisis cere¬ 
bral). El examinador dice una palabra y el 
individuo intenta selcccionar entre cuatro 
laminas aquclla que representa la palabra. 

10. La Columbia Mental Maturity Seal< 
(CMMS). cuyas normas se establecieron* 
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cl decenio de I960 para personas de 3 afios 
y medio a 10 afios de cdad, es una prueba 
de la capacidad de razonamicnto sdlida en 
tdrminos psicomdtricos y que sc disefid para 
nifios con altcraciones sensoriales, moto- 
ras o del habla. Sc pidc al nifio que, de un 
grupo de 3 a 5 dibujos, “scfiale el que no 
pertenccc a los demds”. La CMMS requi¬ 
re una nueva estandarizacidn. 

11. Pruebas rcspctadas para personas con alte- 
raciones visualcs incluyen la Perkins-Binet, 
una adaptacidn de la Stanford-Binet; la 
HISAB, una modificacidn de las subpruc- 
bas de ejecucidn de Wechslcr; y la Blind 
Learning Aptitude Test (BLAT), una medi- 
da de tipo Braille acerca de la formacidn de 
conceptos y el razonamiento abstracto. 

12. El retraso mental se define con base en ires 
criterios: funcionamicnto intelectual gene¬ 
ral inferior al promedio, el cual se define 
por lo comun como un Cl mcnor a 70 (o 75 
en casos excepcionalcs), limitaciones en dos 


o mds dreas de habilidad adaptativa y brote 
previo a los 18 afios de cdad. 

13. Las Scales of Independent Behavior-R 
(SIB-R) son una medida de la conducta 
adaptativa sumamente utiles en la evaluacidn 
del retraso mental. Un padre, maestro o 
persona encargada del cuidado del pacien- 
te responde a una serie de 14 subescalas 
relacionadas con habilidades motoras, ha- 
bilidades sociales y de comunicacidn, habi- 
lidadcs de vida personal y habilidades de 
vida comunitaria. 

14. La Independent Living Behavior Checklist 
(ILBC) cs un compendio referido a criterio 
y originado en el tratamiento que presenta 
343 habilidades para la vida independiente. 
La confiabilidad test-retest y la concordan¬ 
ce interobservadores para las habilidades 
de la ILBC son excepcionalmente alias. Esta 
prueba ayuda a guiar la rehabilitacidn con- 
tinua de personas con discapacidadcs del 
dcsarrollo. 




rtRMINOS Y CONCEPTOS CLAVE 


Ley Publica 93-112 
Ley Publica 94-142 
Ley Publica 99-457 


p. 264 Decreto sobre los estadouni- 

p. 265 denscs con discapacidades p. 266 

p. 266 Retraso mental p. 279 
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Tema 7B 

Sesgo de una prueba y 
otras controversias 


La cuesti6n del sesgo de una prueba 
Valores sociales y equidad de una prueba 
Determinates geneticos y ambientales de la inteligencia 
Origenes de las diferencias de Cl entre personas afroestadounidenses y de 
raza blanca 

Cambios de inteligencia con la edad 

Cambios generacionales en las calificaciones de pruebas de inteligencia 
Resumen 

Ttminos y conceptos clave 

PKKHBBHnnHBvinnsr 



CJna prueba de inteligencia es una he- 
rramienta neutra e inconsecuente hasta que 
alguien le asigna significado a los rcsultados 
obtcnidos de ella. Una vez logrado esto, el exa- 
minado experimental muchas sensaciones, 
que van desde las superficiales hasta aqueilas que 
cambian su vida; seran justas o injustas, utiles 
odaninas, apropiadas o enganosas, dcpendicn- 
do del significado que se vincule con la califi- 
cacidn de la prueba. 

Por desgracia, la tendencia a infundirle 
connotaciones imprecisas e injustificadas a las 
'-alificaciones de una prueba de inteligencia cs 


muy generalizada. Es comiin que legos y estu- 
diantes de psicologfa se pierdan en erTores con¬ 
ceptual daninos. A los resultados de una 
prueba se les asignan valores exagerados o bien 
se les resta importancia cuando algunas perso¬ 
nas los interpretan como prediccidn de la valfa 
personal, mientras que otros los devaluan por 
considerarlos triviales e injustos. 

El propdsito de este tema es aclarar aun nuts 
cl significado de las calificaciones de una prue¬ 
ba de inteligencia a la luz de la investigacidn 
conductual pertinente. En tdrminos cspecfficos, 
sc analizardn cinco aspcctos —algunos dirian 
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quc controversias— que lienen que vcr con el 
significado de las calificaciones de una prueba 
de inteligencia: 

• el problema de la parcialidad dc prueba. 

• los efectos geniticos y ambientales dc la inte¬ 

ligencia. 

• los orfgcnes dc las difercncias de Cl cntre 
afroestadounidenscs y caucisicos. 

• el destino de la inteligencia en la madurcz y vejez. 

• los cambios generacionales en las calificacio- 

ncs de una prueba de inteligencia. 

El lema fundamental dc esta seccidn es que las 
calificaciones dc una prueba de inteligencia 
pueden comprcndersc mejor dentro del csque- 
ma de la investigacidn psicoldgica modema. Se 
advierte al lector que las cucstiones de in- 
vestigacidn que se tratan aquf son complejas, 
confusas y, en ocasiones, contradictorias. No 
obstante, las recompensas de tratar estos temas 
son sustanciales. Despuds de todo, el significado 
de las pruebas de inteligencia se demarca, afi- 
na y depura por complcto a travds de la investi- 
gacidn cientffica. 




LA cuesti6n del sesgo 

DE UNA PRUEBA 


Sin duda. ninguna prictica dentro de la psico- 
logfa modema ha recibido tantos ataques como 
las pruebas psicoldgicas. Los crfticos le reser- 
van una condena especial, y con frecuencia 
vehemcnte, a las pruebas dc capacidad. En su 
amplia respuesta a las miles de crfticas dirigi- 
das a las pruebas menlales, Jensen (1980) con- 
cluyd que el sesgo de una prueba es cl punto en 
el que suelen concentrarse los crfticos. Al de¬ 
clarer el sesgo dc una prueba, los escdpticos 
expresan de diversas maneras que las pruebas 
son tan parciales en tdrminos culturales y sexua- 
les quc discriminan injustamente a minorfas 
raciales y dtnicas, mujercs y pobres. Se citan 
aquf al pie de la letra una mucstra de crfticas 
(Jensen, 1980): 

• Las pruebas dc inteligencia lienen un nombre 
tristemente equivocado, debido a que nurvea 


tuvieron el propdsito de medir la inteligencia y 
podn'an Uamarse de manera mis adccuada 
pruebas de AC (anteccdentes culturales). 

• Las personas con antecedentes diferentes a 
los de la culture en la que se dcsarrolld la 
prueba siempre resultarin penalizadas. 

• Existen cnormes difercncias de clasc social 
en el acceso de un nifto a las expericnciai 
neccsarias para adquirir las habilidades inte- 
lectuales vilidas. 

• Las calificaciones de Cl presentadas para los 
afroestadounidenses y para los grupos dc ni- 
vel socioecondmico bajo en EUA reflejan 
caraclcrfsticas de la prueba mis que de quie- 
nes la responden. 

• El bajo dcsempefto de los nifios afroestado¬ 
unidenses en las pruebas convencionales se 
debe al sesgo en el contenido de las pruebas; 
es decir, cl material de dslas sc obtiene dc 
otros sitios ajenos a esa culture. 

• Las mujeres no son tan buenas en matemili* 
cas como los varones porque no ban tornado 
tantas clascs de matcmiticas en preparatoria 
y universidad. 

^Son vilidas estas crfticas? La investigaci6n 
sobre este asunto resulta ser mucho mis com- 
plicada de lo que el lector podrfa suponer. Un 
aspecto mis importante es que las aparicncias 
pueden ser engafiosas. Como se cxplicari mis 
adelante, cl hecho de que los rcactivos de prue¬ 
ba “parezean’’ o "se sientan" como preferen- 
ciales para una raza, sexo o clase social no 
constituye evidencia de sesgo de una prueba. 
£ste es un asunto objetivo, empfrico, no una 
cuestidn de juicio personal. 

Aunque los crfticos pueden estar reacios a 
admitirlo. sf existen mdtodos imparciales y ob- 
jetivos para investigar el sesgo de una prueba, 
Uno de los propdsitos de esta seccidn es pre- 
sentarlc dichos mdtodos al lector. No obstante, 
una discusidn asdptica sobre ecuaciones de re- 
gresidn y definiciones estadfsticas del sesgo dc 
una prueba serfa incompleta al dar sdlo una 
mitad dc la historia. Los conceptos dc sesgo de 
una prueba estin irremediablemenle entremez- 
clados con las nociones dc equidad de prueba. 
Una explicacidn complcta de la historia que ro- 
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dea a la controversia sobre el sesgo de una prue¬ 
ba requiere que se invcstigue tambidn la cues- 
ii6n relacionada de la cquidad dc la misma. 

En esta drea abundan las diferencias en tcr- 
minologi'a. por lo cual es importante establecer 
ciertas distinciones fundamentalcs antes de pro- 
ceder. El sesgo de una prueba es un concepto 
tdcnico receptivo al analisis imparcial. Mds 
adelante se analizan los mdlodos mds notables 
para la evaluacidn objetiva del sesgo de una 
prueba. En contraste. la cquidad de la misma 
refleja valores sociales y filosoffas sobre la uti- 
lizacidn de prucbas. en particular cuando dsta 
se extiendc a la seleccidn con cl propdsito de 
conceder privilegios u otorgar un emplco. Gran 
parte de la pasidn quc rodea a la controversia 
sobre cl sesgo dc una prueba se deriva de un 
fracaso para distinguir dicho sesgo de la cqui¬ 
dad dc una prueba. Para evitar la confusidn, es 
importante establecer una clara distincidn cn- 
tre estos dos conceptos. Sc incluyen andlisis 
separados para el sesgo y la equidad de prueba, 
comenzando con la pregunta de por qud el ses¬ 
go de una prueba es un tema tan poldmico. 

CONTROVERSIA ACERCA DEL SESGO 
DE UNA PRUEBA 

La controversia acerca del sesgo de una prue¬ 
ba liene sus orfgenes en las diferencias obser- 
vadas en el Cl promedio enlre di versos grupos 
raciales y dtnicos. Por ejemplo, los afrocstado- 
unidenses oblienen, en promedio, cerca de 15 
punlos mcnos que los estadounidenses de raza 
blanca en pruebas estandarizadas dc Cl. Esta di- 
ferencia se reduce de 7 a 12 puntos de Cl cuando 
se toman en cuenta las disparidades socioecond- 
micas. La existencia de cstas notables diferencias 
raciales/dtnicas ha alimentado la controversia 
acerca del sesgo de una prueba. Despuds de 
todo, las oportunidades de empleo, admisi6n a 
la universidad, obtencidn del certificado de ba- 
chillerato y asignacidn a clases de educacidn 
especial estdn gobernados, en parte, por los re- 
sultados de una prueba. Las prucbas sesgadas 
pueden perpetuar el legado de la discriminacidn 
racial. El sesgo dc una prueba es, con absoluto 


derecho, un tema dc intenso escrutinio del pu¬ 
blico tanto cuanto de las profesiones dedicadas 
a las pruebas. 

Una posibilidad es que las disparidades ob- 
servadas en el Cl indiquen sesgo de una prue¬ 
ba mds que diferencias grupales significativas. 
De hecho, la mayorfa dc los legos, e incluso 
algunos psicdlogos, considerarfan la magnitud 
dc las diferencias raciales en Cl como eviden- 
cia razonablc de que las pruebas dc inteligencia 
tienen un sesgo cultural, fete es un argumento 
tentador, pero una gran diferencia entre sub- 
poblacioncs definidas no es base suficiente para 
comprobar la existencia del sesgo en una prue¬ 
ba, sino que debc depender de otros criterios 
que se estableccn mds adelante. 

Las diferencias raciales y dlnicas no son la 
unica fundamcnlacidn para la controversia acer¬ 
ca del sesgo de una prueba. Tambidn cxisten 
diferencias sexualcs significativas en algunas 
medidas de capacidad, en particular en el drea 
del pensamiento espacial (Maccoby y Jacklin, 
1974; Hal pern, 1986). En un estudio (Gregory, 
Alley y Morris. 1980), los varones obtuvieron 
mayorcs calificaciones que las mujeres en cl 
componente dc razonamiento espacial dc la 
Differential Aptitude Test que alcanzaron una 
magnitud dc una desviacidn esldndar comple- 
ta. Dichos datos haccn surgir la posibilidad de 
quc cstas pruebas pueden estar sesgadas en fa¬ 
vor de los hombres, pero, £c6mo saberlo?, 
^cudndo las diferencias en las calificaciones 
de una prueba entre grupos representan sesgo dc 
la misma? Se comcnzard con una revisidn de los 
criterios que deberfan ulilizarse para investigar 
cl sesgo dc una prueba de cualquier tipo, ya sea 
racial, sexual o en relacidn con cualquier otra 
caracterfslica definitoria. 


CRITERIOS DE SESGO Y EQUIDAD 
DE PRUEBA 

El tema del sesgo de una prueba ha recibido 
amplia atencidn por parte de psicdlogos de la 
mcdicidn, aulores de pruebas, periodistas, cr(- 
ticos dc pruebas, Icgisladores y tribunales. Cole 
y Moss (1989) subrayan una consecuencia 
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pcrturbadora de la prolifcracidn de las perspec¬ 
tives acerca de estc tema; es decir, que los con- 
ceptos de sesgo de una prueba se han vuelto 
cada vez m6s indescifrables y complejos. Lo 
que es m5s, la comprensidn de dste se vuelve 
diffcil debido a las suposiciones impli'citas y con 
frecuencia emocionales —que sostienen inclu¬ 
sive los acaddmicos— y que pueden conducir 
a personas honradas a examinar la misma in- 
formacidn de diferentes maneras. 

En parte, los desacucrdos se perpetuan de¬ 
bido a que los interesados cn este debate no 
pueden aclarar la terminologfa esencial. Con 
demasiada frecuencia ocurre que tdrminos como 
sesgo de uua prueba y equidad de prueba sc 
consideran intercambiables y se usan de mane- 
ra indefinida, sin definirlos. Se propone que, 
por lo comun, “sesgo de una prueba" y “equidad 
de prueba” se refieren a aspectos notablemen- 
te diferentes del debate acerca de parcialidad 
de prueba. El examen cuidadoso de ambos con- 
ceptos proporcionara una base para un andlisis 
mds razonado de estc poldmico tema. 

Segun lo interpretan la mayon'a de las au- 
toridades cn este campo, sesgo de una prueba 
se reficre a indices estadfsticos objetivos que 
examinan el patrdn de las calificaciones de una 
prueba con subpoblaciones apropiadas. Aun- 
que los expertos podrfan discrepar acerca de 
cicrtos malices, en la generalidad de los casos 
existc conscnso sobre los criterios estadfsti¬ 
cos que indican cuando una prueba esld sesgada. 
Despuds se hablard mds sobre este punto, pero 
aquf sc le proporciona al lector un avancc bre¬ 
ve: en general, una prueba se considera sesgada 
si es vdlida de manera diferencial para diferen¬ 
tes subgrupos; por ejemplo, si las calificacio- 
nes de subpoblaciones apropiadas no caycran 
dentro de una misma lfnea de regresidn para un 
criterio pertinente. 

En contraste con el estrecho concepto del 
sesgo de una prueba, la equidad de una prue¬ 
ba es una idea amplia que reconocc la impor- 
tancia de los valores sociales en el uso de 
pruebas. Incluso si una prueba no cstd sesgada 
segun los criterios tdcnicos tradicionales de 
regresidn homogdnea, podrfa tonsiderarse in- 
justa debido a las consecuencias sociales de uti- 


lizarla para tomar decisiones de seleccidn. El 
punto esencial del debate es dste: el sesgo de 
una prueba (un concepto estadfslico) no ncce- 
sariamente es igual a la equidad de la misma 
(un concepto de valores). En ultima instancia, 
la equidad de prueba se basa en conceptos so¬ 
ciales como la imagen que se tiene acerca de 
una sociedad justa. En la evaluacidn de 6sta, 
los valores subjetivos tienen la mayor impor- 
tancia; los criterios estadfsticos de sesgo de una 
prueba son meramente subordinados. Se regre- 
sara a este punto mtis adclante cuando se anali- 
ce el vinculo entre valores sociales y equidad 
de una prueba. Pero se comenzard con una pre- 
sentacion tradicional de los criterios tdcnicos 
del sesgo de una prueba. 

SIGNIFICADO TECNICO DEL SESGO 
DE UNA PRUEBA: UNA DEFINICl6N 

Una manera util de analizar el sesgo de una 
prueba es desde la pcrspectiva tradicional de la 
validacidn. El lector recordard de un capftulo 
anterior que una prueba es vdlida cuando una 
variedad de evidencia sustenta su utilidad y 
cuando las inferencias obtenidas de ella son 
apropiadas, significativas y provechosas. Una 
implicacidn de estc punto de vista es que el ses¬ 
go de una prueba puede igualarse con la vali- 
dez diferencial para diferentes grupos: 

B sesgo esld presente cuando la calilicacibn de 
una prueba tiene slgnificados o Implicaclones 
diferentes para un subgrupo pertinente y defini- 
ble de individuos evaluados con respecto a los 
signiflcados o Implicaciones para las demds per¬ 
sonas examinadas. Asi, el sesgo es la validez 
diferencial de una interpretacibn dada a la callfi- 
cacibn de una prueba para cualquier subgrupo 
definible y pertinente de individuos examinados 
(Cole y Moss. 1989). 

Quizas un ejemplo concreto ayudard a aclarar 
esta deftnicidn. Supdngase que se utiliza una 
prueba aritmdtica de problemas simples expre- 
sados con palabras para medir las habilidades 
de suma de individuos jdvenes. Los problemas 
podrfan exprcsarse de la siguiente manera: "si tic- 
nes dos six-packs de refresco, ^cudntas latas 
tienes en total?". No obstante, supdngase que 
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|a prueba sc utiliza cn un grupo de ninos de se¬ 
cundaria que proccdcn de anlecedentes de ha- 
bla hispana. Con dstos, las calificaciones bajas 
podrfan indicar una barrera del lenguaje, no un 
problema en sus habilidades aritmdticas. En 
contraste, para nifios de habla inglesa, las cali¬ 
ficaciones bajas indicanan con mayor probabi- 
lidad un deficit en habilidades aritmbticas. En 
eslc ejemplo, la prueba (iene validez difercncial 
al predeeir muy bicn las dcficiencias aritmbti- 
cas para ninos de habla inglesa. pero de mane- 
ra inadecuada para los de habla hispana. Segun 
la perspcctiva tdcnica de la validacibn de una 
prueba, sc conclum'a que la prueba esta sesgada. 

Aunque la dcfinicibn general de sesgo de 
una prueba se refiere a la validez diferencial, 
cn la prlctica los criterios particularcs cacn bajo 
ires encabezados principales: validez de contc- 
nido, validez rclacionada eon el criterio y vali¬ 
dez de constructo. Se revisarl cada una de cstas 
categorfas y se analizarln las conclusioncs 
pertinentes. La cobertura es ilustrativa, no ex- 
haustiva. Se sugiere a los lectores interesados 
consullar a Jensen (1980), Cole y Moss (1989) 
y Reynolds y Brown (1984b). 

SESGO EN LA VALIDEZ DE CONTENIDO 

Es probable que el sesgo en la validez de con- 
tenido sea la crftica mas comun de aqucllos que 
dcnuncian el empleo de las pruebas estandari- 
zadas con minorfas (Hilliard, 1984). Por lo co¬ 
mun, los crlticos se basan en su propio juicio 
cuando expresan una o mils de las siguientes 
crfticas sobre la validez de contenido de las 
pruebas de capacidad: 

1. Los reactivos piden informacion que los ni¬ 
fios que provienen de minorfas o que sufren 
desvcniajas no tienen igual oportunidad de 
aprender. 

2. Los reactivos se califican de manera inapro- 
piada debido a que el autor de la prueba ha 
decidido arbitrariamente cull es la unica res- 
puesta correcta y a los nifios de minorfas se 
les califica de modo inadecuado por dar res- 
puestas correctas en su propia cultura, pero 
no para el autor de la prueba. 


3. El fraseo de la pregunta es poco familiar y es 
posible que un nino que pertenece a una 
minorfa y “sabe” la respuesta correcta no 
pueda responder porque no comprende la 
pregunta (Reynolds y Brown, 1984a). 

Si cualcsquicra de estas crfticas fuera precisa, 
serfa una evidencia autbntica de sesgo de una 
prueba; no obstante, el hecho de expresar 
una crftica no constituye prueba. El error de 
estas crfticas es que en pocas ocasiones se fun- 
damentan en evidencia cmpfrica. 

Reynolds (1982) ha ofrccido una definicibn 
de sesgo del contenido para pruebas de apti- 
tud que atiende a los puntos anteriores en tdr- 
minos definidos a nivel empfrico y que pueden 
someterse a prueba: 

Un reactivo o subescaia de una prueba so consi¬ 
der sesgado en contenido cuando se demues- 
tra que es retativamente m&s diffcil para los miem- 
bros de un grupo quo para otros, cuando se man- 
tiene constants el nivel de capacidad general de 
los grupos comparados y no existe ninguna 
lundamentacidn teorica razonablo que explique 
las dilerencias grupales en el reactivo (o subes¬ 
caia) en cuestibn. 

Esta definicibn es dtil debido a que propone un 
enfoque empfrico a la cuestibn del sesgo de una 
prueba. 

En general, los intentos por probar que los 
reactivos postulados por los expertos son 
culturalmente sesgados no han producido la 
evidencia concluyentc que los crfticos esperan. 
McGurk (1953a, 1953b, 1967, 1975) ha escrito 
de manera extensa sobre este tema y sc utilizarl 
su estudio para ilustrar este asunto. Para su te- 
sis doctoral, McGurk le pidid a un panel de 78 
jueces (profesores, educadorcs y cstudiantes de 
posgrado en psicologfa y sociologfa) que clasi- 
ficaran en una de tres categorfas cada uno de 
los 226 reactivos de pruebas cstandarizadas 
de inteligencia ampliamente conocidas. Las ca¬ 
tegories eran: menos cultural, neutra, mis cul¬ 
tural. McGurk aplicb cstos reactivos de prueba 
a cientos de estudiantes de educacibn media. 
Su primer anllisis implied los resultados de 
prueba de 213 cstudiantes afroestadounidenses 
y 213 estudiantes de raza blanca, cquiparados 
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scgun cum'culo, escuela, tiempo de estar ins- 
critos y antecedentcs socioeconbmicos. 

McGurk (1953ab) descubri6 quc la dife- 
rencia media entre estudiantes afroestadouni- 
denscs y de raza blanca en el total de la prueba 
hfbrida, expresada en unidadcs de dcsviacibn 
estlndar, era de 0.50. Su comparacibn de las 
califtcacioncs en los 37 reactivos ‘‘mis cultu- 
rales” contra los 37 “menos culturales" estl mis 
relacionada con el tcma del sesgo de una prue- 
ba en la validez de contenido. Para los reactivos 
“mis culturales” (aquellos quc los jucces con- 
sideraron como los de mayor sesgo cultural) la 
difercncia fue de .30. En cl caso de los “menos 
culturales” (aquellos que los jueces considera- 
ron mis justos para los afrocstadounidcnscs y 
otras minorfas culturales) la diferencia fue de 
.58. En otras paiabras, los reactivos dcsigna- 
dos como mis culturales fueron relativamente 
flciles para los afroestadounidenses, mientras 
aqudllos menos culturales fueron relativamen¬ 
te mis diffciles. Esta conclusibn resultb cierta 
incluso despubs de que se tomb en cucnta la 
dificultad de los reactivos. Ademls, estas difi- 
cultades para los dos grupos se corrclacionaron 
a un nivel casi perfecto (r = .98 para los reac¬ 
tivos “mis culturales" y r = .96 para los “me¬ 
nos culturales”). En esto reside una importante 
leccibn que con frecuencia pasan por alto los 
crfticos de las pruebas: los jueces "expertos" no 
pueden idcntificar los reactivos sesgados en tdr- 
minos culturales con base en un anllisis de las 
caracterfsticas del reactivo. 

En general, con respecto a las pruebas 
estandarizadas de capacidad y aptitud que mis 
se conoccn, la investigacibn no ha apoyado la 
creencia popular de quc el contenido espeeffi- 
co de los reactivos de una prueba es una fuente 
de sesgo cultural contra las minorfas. Esta con¬ 
clusibn no exonera a estas pruebas con respec¬ 
to a otros criterios de sesgo que se analizan a 
continuacion. Lo que es mis, se puede senalar 
que los aulores de una prueba que tengan senti- 
do comun deberian estar alertas incluso ante la 
impresibn de sesgo en el contenido de una prue¬ 
ba, dado quc la apariencia de inequidad puede 
afectar de manera bastante tangible las actitudes 
publicas acerca de las pruebas psicolbgicas. 


SESGO EN LA VAUDEZ PREDICT1VA 
Y RELACIONADA CON EL CRITERIO 

La prediccibn del desempeno future es uno de 
los usos importantes de las pruebas de inteligen- 
cia, capacidad y aptitud. Para esta aplicacibn 
en cl examen psicolbgico, la validez prcdictiva 
es la forma mis importante de validez en rela- 
cibn con el sesgo de una prueba. En general, 
una prueba imparcial predecirl por igual el 
desemperio future de personas que vienen de 
subpoblaciones diferentes. Por ejemplo, una 
prueba imparcial de la aptitud escolar pronos- 
ticarl el desempeno acadbmico future de los 
estadounidenses de raza negra y blanca con una 
prccisibn casi idbnlica. 

Reynolds (1982) ofrece una dcfinicibn cla- 
ra y directa del sesgo de una prueba con res¬ 
pecto a la validez relacionada con el criterio o 
el sesgo en la validez prcdictiva: 

Una prueba se considera sesgada con respecto 
a ta validez predlcliva cuando la inlerenda deri- 
vada de la calillcacldn de una prueba no se rea¬ 
lize coo el menor error aleatorio posible o si exte- 
te un error constanle en una inferencia o predic- 
cidn en tuncion de la membresia a un grupo en 
particular. 

Esta definicibn invoca lo que podrfa deno- 
minarsc el criterio de regresibn homogbnea. 
Scgun este punto de vista, una prueba es im¬ 
parcial si los resultados para todas las subpobla¬ 
ciones rclacionadas se agrupan por igual 
alrededor de una sola Ifnea de regresibn. A fin 
de aclarar este punto, es necesario introducir 
conccptos rclacionados con la regresibn sim¬ 
ple. El anllisis se basa en el trabajo de Cleary, 
Humphreys, Kendrick y Wesman (1975). 

Supbngase que se estl utilizando una prue¬ 
ba de aptitud escolar para predecir el promedio 
general de calificacioncs (pgc) del primer aflo 
en la universidad. En el caso de un anllisis de 
regresibn simple, la prediccibn del desempe¬ 
no future se realiza a partir de una ecuacibn 
como la siguiente: 

YmbX + a 

donde Y es cl pgc pronosticado para la uni¬ 
versidad, X es la calificacibn en la prueba de 
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jptitud y by a son constantes obtenidas de un 
an&lisis estadfstico de las calificacioncs de una 
prueba y de cstudiantes anteriores. No nos prc- 
ocuparemos aquf por la manera en que se ob- 
tienen b y a\ el lector pucde encontrar esta 
jnformacidn en cualquier libro sobre estadfsti- 
c a elemental. 

Los valores de b y a corresponden a im- 
portantcs aspectos de la Ifnea de regresidn —la 
Ifnea recta que facilita la prediccidn mis preci¬ 
sa del criterio (calificacioncs universitarias) a 
partir de un medio de prcdiccidn (calificacidn 
de aptitud; figura 7-4). En particular, b corres¬ 
pond a la pendiente de la Ifnea. donde sus va¬ 
lores mds altos indican una pendiente mds 
pronunciada y una prediccidn mils precisa. El 
valor de a represents la intcrcepcidn en el eje 
vertical. Las unidades de medida para b y a no 
pucden especificarse de antemano, ya que 
dependen de las esealas subyacentes utilizadas 
para X y Y. Obsdrvese en la figura 7-4 que la 
Ifnea de regresidn es la refcrcncia para prede- 
cir calificacioncs a partir de una calificacidn de 
aptitud observada. 

De acuerdo con cl criterio de regresidn 
homogdnea, en una prueba imparcial una sola 


Ifnea de regresidn puede predecir por igual cl 
desempeno de (odas las subpoblaciones perti- 
nentes, aunque puedan diferir las medias para 
los diferenles grupos. Porejemplo, en la figura 
7-5, el grupo A tiene un mejor desempefio que 
el grupo B, tanto en el medio de prediccidn co- 
mo en cl criterio. No obstante, la relacidn entre 
la calificacidn de aptitud y las calificaciones 
es la misma para ambos grupos. En cstc ejem- 
plo hipotdtico. la grdfica representa la ausencia 
de sesgo en la prueba de aptitud con respecto a 
la validcz rclacionada con el criterio. 

En la figura 7-6 se mucstra una situacidn 
mds compleja que se conoce como sesgo de 
intercepcidn. En este caso, las calificaciones 
para los dos grupos no se agrupan de manera 
estrecha alrcdcdor de la mejor Ifnea de regre- 
sidn mostrada como una Ifnea puntcada en la 
grdfica. Se necesitarfan lfneas dc regresidn se- 
paradas y paralelas (y, por tanto, se requerirfan 
ecuacioncs separadas dc regresidn), para faci- 
litar la prediccidn precisa. Si se utilizara una 
sola Ifnea de regresidn (la Ifnea punteada), las 
calificaciones de criterio para el grupo A se 
sobrcpronosticarfan, mientras las puntuaciones 
de criterio para el grupo B se subpronosticarfan. 



Catiflcacidn en una prueba de aplltud 

N«ti: La tinea punleada muestra la manera en que puede emploarse la linea de regresldn pa/a predear el promedio de caMIcaciones 
* oariir de las caMIcaciones on una prueba de un solo indnriduo nuevo 


flflvira 7-4, Puntuaciones de prueba, calificaciones y linea de regresibn para un gran grupo hipolbtico de estudian- 

les universitarios 
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Flgura 7-5. Puntuaciones da prueba, calificaciones y llnea linlca de regresibn para dos subpoblaciones grandes, 
hipoteticas, de estudiantes universitarios, 


Asf, el empleo de una sola linea de regresidn 
constituirfa un caso claro de parcialidad de 
prueba, dado quc dicha prueba tiene una vali- 
dez predictiva diferencial para diferentes 
subgrupos (contrario a la creencia que se tiene 
cn general, el sesgo de una prueba en estos ca- 
sos favorece de hecho al grupo con menor 


calificacidn dado que su dcscmpcrto en el crite- 
rio sc sobrcprcdice. Por tanto, en ocasioncs el 
sesgo de una prueba puede favorecer a los gru- 
pos minoritarios). 

Pero, ;,que sucede si se utilizan I mens de 
rcgresidn independientes para cada subgrupo? 
i,Esto resolvcrfa cl problema y rescatarfa a la 



Flgura 7-6. Puntuaciones de prueba, calificaciones y lineas paralelas de regresibn para dos subpoblaciones gran¬ 
des, hipoteticas, de estudiantes universitarios. 
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prueba del sesgo relacionado con cl critcrio? 
Las opinioncs difieren en cuanto a cste punto. 
Aunque no existe duda de que el uso de 
ecuaciones de regresidn separadas au men tan a 
la precision predictiva de la mueslra combina- 
da, csta a discusidn si dicha prdctica producirfa 
cquidad de la pmeba. Se regresard a csta cues- 
lidn mas adelante, cuando se discuta la perti- 
nencia de los valorcs sociales en relacidn con 
laequidad dc la pmeba. 

Varios investigadorcs han analizado el ses¬ 
go de una prueba en cuanto a la validcz rclacio- 
nada con el criterio de la Scholastic Aptitude 
Test (Prueba dc Aptitud Escolar). ahora cono- 
cida como Scholastic Assessment Test (Prueba 
de cvaluacidn escolar) que se analiza en un ca- 
pitulo anterior (Cleary. Humphreys, Kendrick 
y Wesman, 1975; Breland, 1979; Manning y 
Jackson, 1984). Una conclusion consistente es 
que se necesitan lfneas independientes y para- 
lelas de rcgresiOn para individuos afroestado- 
unidenscs y dc raza blanca. Por ejemplo, en 
una escuela, las ecuacioncs Optimas de regre- 
sidn para estudiantes afrocstadounidcnscs, de 
raza blanca y combinados fue la siguiente: 

Afroesladounidenses: K = .055 + .0024 V+ .0025 M 
De raza blanca: Y= .652+ .0026V+.001 \M 

Combinados: K=.586 + .0027V'+.0012Af 

donde Y es el pronOstico del promedio de cali- 
ficaciones universitarias, B es la calificacidn 
Verbal de la SAT y M es la calificacidn de 
Matemiiticas de la SAT (Cleary y col., 1975, p. 
29). El efecto dc utilizar la formula para perso¬ 
nas de raza blanca o para la combinacidn de 
estudiantes es que se sobreprediccn las califi- 
caciones universitarias de los individuos afro- 
estadounidenses con base en los resultados de 
la SAT. En la escala traditional de cuatro pun- 
tos; (A = 4, B = 3, etc.), la cantidad promedio 
dcsobreprcdicciOn de 17 estudios independien¬ 
tes fuc de .20 o una quinta parte de un punto de 
ealificaciOn (Manning y Jackson. 1984). Lo que 
significan cstos resultados estd abierto a deba- 
'e. pero parece claro que, cuando menos, la SAT 
y ex&mencs similares de ingreso no subprcdicen 


las califlcaciones universitarias de los miem- 
bros dc minorfas. 

En la figura 7-7 se represenla el resultado 
mils peculiar dc rcgrcsiOn, conocido como ses¬ 
go de pendiente. En este caso, las lineas de rc- 
gresidn para subgrupos independientes no son 
ni siquiera paralelas; por (anto, utilizar una sola 
de cllas (la Ifnea punteada) para la prcdiccidn 
podrfa rcsultar tanto en una subprediccidn como 
en una sobreprediccidn de las califtcacioncs de 
personas seleccionadas en ambos grupos. La 
opinidn profesional serfa unanime en este caso: 
csta prueba posec alto grado de sesgo en cuan¬ 
to a la validez relacionada con el criterio. 


SESGO EN LA VALIDEZ DE CONSTRUCTO 

El lector recordard que la validez de constructo 
dc una prueba psicoldgica puede documentar- 
sc a travds dc diversas formas de evidencia, 
incluycndo patroncs del dcsarrollo apropiados 
en las califlcaciones de una pmeba; cambios en 
dstas, debidos a una intervencidn, que sean con- 
sistentes con la (eorfa; y andlisis factorials 
conftrmatorios. Dado que la validez de cons- 
tructo es un concepto tan amplio, la deftnicidn 
dc sesgo en la validez dc constructo requie- 
re dc un plantcamicnto general receptivo a la 
investigacidn desde una variedad dc puntos de 
vista y con una amplia variedad de mdtodos. 
Reynolds (1982) ofrece la siguiente deftnicidn: 

Existe sesgo en la validez de constructo cuando 
se demuestra que una prueba mlde diferentes 
rasgos hipotdticos (constructos psicologicos) en 
un grupo que en otro o mide el mismo rasgo, 
pero con diferentes grados de precisidn. 

Desde una pcrspectiva priictica, de esta defini- 
cidn provienen dos critcrios directos de impar- 
cialidad (Reynolds y Brown, 1984a). Si una 
pmeba es imparcial, entonces las comparacio- 
ncs entre subpoblaciones pertinentes deberfan 
re velar un alto grado dc semejanza en: 1) la es- 
tmetura factorial de la prueba y 2) la clasifi- 
cacirin del nivcl dc dificultad de los reactivos 
dentro de la misma. Se analizarAn en mayor de- 
tallc estos criterios. 
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Figure 7-7. Puntuaclones de prueba, calificaclones y 
grartdes, hlpoldlicas. de estudiantes univarsitarlos. 

Un criterio esencial de la imparcialidad es 
que la estructura factorial dc las calificacio- 
nes debe scr invariable cntrc subpoblaciones 
apropiadas. Por supuesto, incluso dentro del 
mismo subgrupo, la estructura factorial de una 
prueba podrfa diferir cntrc grupos por edad, de 
modo quc es importnntc quc se restrinjan las 
comparaciones entre personas de la misma edad 
en las subpoblaciones apropiadas. Para indivi- 
duos de la misma edad, una prueba imparcial 
poseerb la misma estructura factorial entre 
subgrupos. En particular, en el caso dc una prue¬ 
ba imparcial, el numero de factorcs que sur- 
gen y las cargas factoriales de los reactivos o 
subescalas serbn sumamente similares en las 
subpoblaciones relacionadas. 

En general, cuando se realiza dc manera 
independiente el anblisis factorial de los reac¬ 
tivos o subescalas de las pruebas importantes 
de capacidad y aptitud en mucstras dc raza 
blanca y minoritarias, surgen los mismos fac- 
tores en las subpoblaciones de referencia 
(Reynolds, 1982; Jensen, 1980, 1984). Aun- 
que se han presentado anomalfas menores en 
algunos de cstos cstudios (Scheuneman, 1987; 
Reschly, 1978; Gutkin y Reynolds, 1981; 
Johnston y Bolen, 1984), la investigacibn en 


Ifneas no paraletas de regreston para dos subpoblaciones 


esta brea es mbs notable por sus conclusioncs 
consistentes con respecto a la invarianza 
factorial entre subgrupos. En el cuadro 7-5 se 
present# un resultado completamente comun ob- 
tenido de la comparacibn de nifios estadouni- 
denses anglosa-jones y de origen mexicano en el 
W1SC-R (Geary y Whitworth. 1988). 

Un segundo criterio de imparcialidad en la 
validcz de constructo es quc la clasificacibn de 
reactivos dentro de una prueba. segun el grado 
de dificultad, debe ser sumamente similar para 
las subpoblaciones de referencia. Dado que la 
edad es uno de los principales determinantes 
de la dificultad del reactivo, esta norma sucle 
verificarse por separado para cada grupo de 
edad que cubre una prueba. El lector observarb 
lo quc este criterio no especifica. No especi- 
fica quc los subgrupos rclacionados deban ob- 
tener tasas equivalentes dc aprobacibn en los 
reactivos de una prueba. Lo que es esencial es 
que los reactivos quc son mbs (o mcnos) diff- 
cilcs para un subgrupo deben ser los mbs (o 
menos) diffeiles para otras subpoblaciones im¬ 
portantes. 

El criterio de la clasificacibn similar de los 
reactivos segun su dificultad puede sometersc 
a prueba de manera muy directa y objetiva. Si 
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Cuadro 7-5. Andlisis Factorial Comparative del WiSC-R para 100 nifios 
angtoestadounidenses y 78 nlnos mdxico-estadounidenses 


Cargas factoriales 


Comprension 

Organizacidn 

Libertad de la 

Subpruebas 


verbal 

perceptual 

distractibilidad 


Ang. 

M-E 

Ang. 

M-E 

Ang. M-E 

inlormacidn 

.77 

.77 




Semejanzas 

.75 

.85 




Arltmdtica 





.75 .75 

Vocabulario 

.86 

.86 




Comprensidn 

.76 

.76 




Figuras Incompletas 



.58 

.58 


Ordenamiento de Dibujos 



.77 

.61 


Disefio con Cubos 



.72 

.61 


Ensamble de Objetos 



.72 

.72 



Claves .52 .52 

Ang ■ Angloesladoiinidenses, N • 100 
M-E » Mdxico-estadounldenses, N « 78 

F untile: Adaplado con aulorlzacton de Geary, D. C. y Whitworth, R. H. (1988), Is the factor structure ol the WtSC-R different lor 
Anglo- and Mexican-American children? Journal ol Psychooducatlonal Assessment, fi, 253-260 


sccalcula cl nivel de dificultad dc cada reactivo 
por medio del valor p (porcentaje dc aproba- 
ci<5n) para cada subpoblacidn relacionada, cn- 
tonces es posible comparar las dificultades 
rclativas de los reactivos entre subgrupos de la 
misma edad. De hccho, la semejanza en la cla- 
sificacion de los reactivos segun la dificultad 
para cualquier grupo puede estimarse de ma- 
nera objetiva por medio de un coeficiente de 
correlacidn ( rxy ). Los valores p apareados para 
los reactivos de una prueba constituyen los va- 
lorcs de x y y utilizados en el cdlculo. Entre 
mds cercano estd el valor de r a 1.00, mils simi¬ 
lar sera la clasiftcacidn dc las dificultades de 
los reactivos para ambos grupos. 

En general, las comparaciones entre gru- 
pos en cuanto a la dificultad relativa de los 
reactivos dentro dc las pruebas importantes de 
capacidad y aptitud han producido correlacio- 
ncs que se aproximan a 1.00; es decir, la mayor 
Parte de las pruebas mucstran clasiftcaciones 
sumamentc similares de los reactivos segun su 


grado de dificultad entre subpoblaciones im¬ 
portantes (Jensen, 1980; Reynolds, 1982). En 
un estudio representative, Miele (1979) inves¬ 
ted la dificultad relativa de los reactivos del 
WISC con personas afroestadounidenses y de 
raza blanca en cada uno de los cuatro niveles 
educativos (preescolar, primero, terccro y quinto 
grados). Encontrd que las correlaciones prome- 
dio entre razas (manteniendo constante el nivel 
de grado) para los valores p dc los reactivos del 
WISC fueron de .96 para varones y .95 para 
mujeres. Estos valores fueron apenas diferen- 
tes de las correlaciones entre sexos dentro dc la 
misma raza (manteniendo constante el nivel dc 
grado) donde las correlaciones fueron de .98 
(raza blanca) y .97 (afroestadounidenses). 
Como se scfiald, estos datos no son poco comu- 
nes. En tdrminos generales, en el caso dc las 
pruebas mds conocidas de capacidad y aptitud, 
la clasificacidn dc los reactivos segun el grado 
de dificultad es prdcticamente iddntica para to- 
das las subpoblaciones relacionadas. 
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REITERACION SOBRE EL SESGO 
DE UNA PRUEBA 

Los crfticos que creen que las pruebas estdn 
scsgadas en contra de las minorfas afirman que 
las calificaciones de una prueba subestiman la 
capacidad de los miembros de las minorfas. 
Como se ha analizado en las sccciones anterio- 
res, la hipdtesis del sesgo de una prueba es una 
interrogante cientffica que puede responderse 
de manera empfrica a travds de proccdimientos 
como el andlisis factorial, las ecuaciones de re- 
gresidn, las comparaciones intergrupales de los 
niveles de dificultad para los reactivos “ses- 
gados” e “imparciales" y la clasificacidn de los 
reactivos scgiin el grado de dificultad. En ge¬ 
neral, las pruebas de capacidad y aptitud tienen 
un descmpeno bastante bueno segun estos cri- 
terios. De hecho, no existe un dominio dcntro 
de las pruebas de capacidad y aptitud dondc 
haya habido evidencia acumulativa que sugic- 
ra sesgo de una prueba. Por el contrario, las 
resenas amplias de los estudios empfricos re- 
chazan la hipdtesis de sesgo (Reynolds, 1982, 
1994a; Jensen, 1980; Manning y Jackson, 
1984). 

Ahora se volverd la atencidn hacia el con- 
cepto mis amplio de la cquidad de una prueba. 
<-,Qu£ tan bien satisfacen los instrumentos exis¬ 
tences los criterios de equidad de una prueba? 
Como el lector descubrirti, la cquidad dc una 
prueba implica valores sociales y, por tanto, 
constituye un tema que cs complctamcntc mas 
dcbatible —y debatido— que el del sesgo. 


H VALORES SOCIALES Y EQUIDAD 
g DE UNA PRUEBA 


Incluso una prueba imparcial podrfa conside¬ 
rate injusta debido a las consecuencias socia¬ 
les de utilizaria en las decisioncs sobre scleccidn. 
En contraste con el concepto limitado y objeti- 
vo del sesgo de una prueba, la idea de equidad 
dc una prueba incorpora valores y filosoffas 
sociales del uso de pruebas. Se demostrard al 
lector que, en ultima instancia, la aplicacidn 


apropiada de las pruebas psicoldgicas es, c „ 
csencia, una conclusion dtica que no puede es. 
tablecerse sdlo sobre bases objetivas. 

En un artfculo que merccc mcnciOn detj. 
llada. Hunter y Schmidt (1976) propusieron U 
primera distincidn clara entre las dcfinicioncs 
estadfsticas de sesgo de una prueba y las con. 
cepcioncs sociales de cquidad de la misma. Aun- 
que los autores resenaron con gran precision los 
criterios tfcnicos comuncs del sesgo de una pn*. 
ba, su artfculo es m£s famoso por su dcscrip. 
cidn de tres posturas eticas incompatibles qu c 
pueden y deben afectar el empleo de pruebas. 

Hunter y Schmidt ( 1 976) sefialaron que las 
pruebas psicoldgicas se utilizan con frecucncia 
para los procedimientos de selecci6n institucio- 
nal, como el otorgamiento de empleo o la ad- 
misidn a la universidad. En este contcxto, la 
aplicacidn de los resultados dc una prueba debt 
guiarse por una filosoffa de seleccidn. Por des- 
gracia, en muchas instilucioncs dicha filosoffa 
cs impifeita y no explfcita. No obstante, cuando 
se hacen explfcitos los valores subyacentes, 
pueden distinguirse (res posturas dticas: indivi- 
dualismo no calificado, cuotas e individualis- 
mo calificado. Dado que estas posicioncs dticas 
se encuentran en el centra de las preocupacio- 
nes publicas sobre la equidad de una prueba, sc 
rcvisar&n con cierto detalle. 


INDIVIDUALISMO NO CUALIFICADO 

En la tradicidn estadounidense de competencia 
libre y abierta, la postura del individualismo 
no cualificado dicta que debe seleccionarse, 
sin excepcidn, a los candidatos mejor califia- 
dos para cl empleo, la admisidn a una cscuelati 
otros privileges. Hunter y Schmidt (1976) 
manifiestan las implicaciones de esta posicidn: 

Expresado en el lenguaje de los procedimientos 
de setecckJn institucional, esto signillca que una 
organizackSn deberfa utilizer cualquier inlorma- 
cion que posea para tracer una prediccidn vaiida 
cientificamente del desempefto do cada Indlvi- 
duo y selecclonar siempre a aquetlos con el ma¬ 
yor desempeoo predicho. Esta posicidn parece 
atractlva a primera vista, pero engloba algunas 







Implicadones que la mayoria do las personas 
consider 011 incdmodas. En particular, si la raza, 
sexo o membresla a un grupo dtnico conlriboyen 
a la prediction vdlida del desempeno en una si- 
luacidn dada, mas allA de las contribuciones de 
laicalificaciones de una prueba. entonces aque- 
llo$ que favorecen el individualismo no calificado 
eslan eticamonto obligados a utilizer tal medio 
de prediction. 


CUOTAS 

La postura etica de las cuotas reconoce que 
muchas instituciones burocrdticas y educativas 
dcbcn gran parte de su existencia a la ciudad o 
estado en el cual funcionan. Dado que existen 
por voluntad de las personas, se puede discutir 
que estas instituciones cstdn dticamcnte obli- 
gadas a actuar de manera “polfticamcnte apro- 
piada" para su localizacidn. La consecuencia 
irtgica de dicha postura son las cuotas. Porejem- 
plo, en un lugar cuya poblacidn sea de un ter- 
cio de afrocstadounidenses y dos tercios de 
personas de raza blanca, los procedimicntos de 
selcccion deben admitir candidatos en aproxi- 
madamente la misma proporcidn. Un procedi- 
miento que sc dcsvfa de manera consistente de 
esia norma sc considerarfa injusto. 

Por deftntcidn, las cuotas equitati vas se basan, 
deinicio, en porcentajes de poblacidn. Despuds 
sc tomanan en cuenta los factores que predi- 
cen cl desempefio futuro, como las calificacio- 
ncs de una pruebn. dentro de las poblaciones 
relacionadas. No obstante, una consecuencia de 
las cuotas es que aquellos que sc scleccionan 
nonecesariamcnle tienen las mayores califica- 
ciones on la prueba que se utiliza como medio 
de prediction. 

indmduausmo cualificado 

El individualismo cualificado es una variacidn 
radical del individualismo: 

< Esta postura senala que EUA se opone a nlvel 
constitutional a la discrimlnaciOn con base en la 
raza, religion, origen national o sexo. Una per¬ 
sona que aboga por el individualismo cualificado 
interpreta esto como un imperative Otlco de ne- 
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garse a utlllzar la raza, el sexo y demas como 
medio de prediction, inclusive si, de hecho, lue- 
ra cientfficamente vOlido hacerlo (Hunter y 
Schmidt, 1976). 

Con propdsitos de seleccidn, el seguidor del 
individualismo cualificado dependen'a, exclusi va- 
mente, de las capacidades sometidas a prueba, 
sin referenda a edad, sexo. raza u otras carac- 
tcrfsticas dcmogdftcas. Esto parecc loable, pero 
se analizan las consecuencias potcncialcs. 
Supongase que el individualista cualificado uti- 
lizara las califtcaciones de la SAT con propdsi¬ 
tos de admisidn a la universidad. Aunque 
aqudllas para afroestadounidenses y personas 
de raza blanca producen Ifneas independien- 
tes de regresidn para el critcrio de las califtcacio- 
ncs universitarias, el individualista cualificado 
cstarfa dticamentc obligado a utilizar la Ifnea de 
regresidn menos precisa, obtenida para toda la 
muestra de solicitantcs. En consecuencia, se 
sobrepredecirfa el desempedo futuro de los 
afroestadounidenses, lo cual en apariencia ele- 
varfa la proporcidn de personas seleccionadas 
de este grupo de solicitantes. Con respecto a 
las proporciones de seleccidn, el impacto prdc- 
tico del individualismo cualificado se encuen- 
tra, por tanto, a la mitad entre las cuotas y el 
individualismo no cualificado. 

reiteraci6n de la equidad 

DE UNA PRUEBA 

i,Cudl ftlosoffa de seleccidn es la correcta? La 
verdad es que este problema se encuentra mds 
alld del espectro de una solucidn racional. En 
un momento u otro, cada una de las posturas 
dticas expresadas antes han encontrado defen- 
sores entre los ciudadanos prudentes, respeta- 
dos y rcflcxivos. Sin embargo, no ha surgido 
un consenso y no es probable que en poco tiem- 
po se lleguc a uno. La disputa se resena aquf: 

... es tiplca de los argumenlos dticos —la resolu- 
ckin depende en parte de valores Irreconcilta¬ 
bles. Lo que es mas, tnduso entre aquellos quo 
concuerdan en sus valores. habrd desacuerdos 
acerca de la validez de tiertas teorias cientlflcas 
relacionadas que atin no se han probado de 
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manera adecuada. Por tanlo, se consldera que 
no exisle manera en que pueda resolverse de mo- 
do objetivo esta disputa. Cada persona debe 
elegir lo que bien le parezca (y de hecho, nos 
encontramos dlvididos) (Hunter y Schmidt, 1976). 

Cuando las posturas dticas chocan —como se- 
guramente ocurrc en la aplicacidn de pmcbas 
psicoldgicas con propdsitos de seleccidn— los 
sistemas judiciales pueden convcrtirse en el ir- 
bitro final, como se analiza despuds. 

B DETERMINANTS GENETICOS 

Y AMBIENTALES DE LA 
INTEUGENCIA _ 


CONTRIBUCIONES GENETICAS 
A LA INTELIGENCIA 

El debate naturaleza-crianza rclacionado con la 
inteligencia es una controvcrsia muy conocida 
y gastada que en estc caso se hard a un lado. Se 
coincide con McGue, Bouchard, Iacono y Lykken 
(1993) en que decenios de estudios sobre adop- 
ci6n, investigacidn familiar y proyectos con geme- 
los han probado la cxistencia de un componente 
gendtico sustancial en la inteligencia, aunque 
los estudios individuates puedan haber sido in- 
suficientes por razoncs particulates: 

Cuando se toman en conjunto, los estudios de 
Cl con gemelos, lamilias y adopcion, demues- 
Iran adecuadamente la existencia de influences 
geneticas sobre el Cl como cualquiera que pue¬ 
da lograrse en las ciencias conductuales con 
mdtodos no experimentales. Sin postular la exis¬ 
tence de Influences geneticas, simpiemente no 
es posible dar una explicaci6n crelble de e cada 
vez m4s consistonte semejanza en Cl entre ge¬ 
melos monocig6ticos (MC). que entre gemelos 
didgdticos (DC) del mismo sexo; la correlaciOn 
significativa en Cl entre famlllares biologlcos. 
aunque se les haya criado por separado; y la luer- 
te relacidn entre la magnitud de la correlacion 
del Cl familiar y el grado de relacidn genetica 
lP-60], 

Por supuesto, la dcmostracidn de una influen¬ 
ce gendtica sustancial en un rasgo no implica 


que la herencia por sf sola sea responsable de 
las diferencias entre individuos —los factores 
ambicntales tambidn son formativos, como se 
re visa mis adelante. 

La contribucibn gendtica a las caracterfsti. 
cas humanas como la inteligencia (medida a 
travds de pmeba de Cl) se evalda en general cn 
tdrminos de un fndice de hereditabilidad que 
puede variar de 0 a 1.0. El indice de heredita¬ 
bilidad es un estimado de la cantidad de 
varianza total cn un rasgo dado, sc debe a fac- 
tores gendticos. Una hereditabilidad de 0.0 sig. 
nifica que los factores gendticos no contribuyen 
a la varianza en un rasgo, mientras la herediu- 
bilidad de 1.0 implica que los factores gendticos 
son los responsablcs exclusivos de la varianza 
en un atributo. Por supuesto, para la mayor parte 
de las caracterfsticas mcdiblcs, la hereditabili¬ 
dad se encuentra entre los dos extremos. MeGue 
etal. (1993) analizan los diversos mdtodos para 
calcular la hereditabilidad, con base en los es¬ 
tudios sobre gemelos y adopcidn. 

Es importante destacar que la heredita¬ 
bilidad es una estadfstica poblacional que no 
puede extenderse para explicar la calificacidn 
individual. Adonis, la hereditabilidad de un 
rasgo dado no es una constante. Como serials 
Jensen (1969), los estimados de hereditabilidad 
“son cspedficos de la poblacidn muestreada, 
el punto en el tiempo, la manera en que se rea- 
lizaron las mediciones y la prueba particular 
utilizada para obtencr las mediciones". En el 
caso del Cl, la mayor parte de los estudios 
presentan estimados dc hereditabilidad que se 
encuentran justo alrededor del .50, lo cual sig- 
nifica que cerca de la mitad dc la variabilidad 
en las calificaciones de Cl sc debe a factores 
gendticos. No obstante, en algunos estudios la 
hereditabilidad del Cl es mucho mis alta, end 
rango del .70 (Bouchard, 1994; Bouchard, 
Lykken, McGue, Segal y Tellegen, 1990; 
Pedersen, Plomin, Nesselroade y McCleam, 
1992). 

Podrfan citarse docenas de estudios para 
demostrar la importancia de los factores gend- 
licos en la determinacidn de la inteligencia 
como se mide a travds de las pruebas de Cl; la bi- 
bliograffa al respccto es casi incontable. Para 
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una iniciacidn en el tema, el lector puede con¬ 
sular a Bouchard (1994) y McGue el al. (1993). 

Una demostracidn de lo mils fascinante 
jcerca de la contribucidn genetica al Cl se en- 
cuentra en el Minnesota Study of Twins Reared 
Apart (Estudio Minnesota de gemelos criados 
por separado; Bouchard el al., 1990). En este 
estudio en proceso. sc reunc a gemelos iddnti- 
cos criados por separado para aplicarlcs un ex- 
tenso examen psicoldgico. Bouchard (1994) 
jn f orma que los Cl obtenidos de cstc estudio se 
correlacionan casi de manera tan elevada como 
losde gemelos iddniicos criados juntos, a pesar 
de que, con frecucncia, los primeros sc vieron 
expuestos a diferentes condiciones ambientales 
(en algunos casos, a ambientes que contrasta- 
ban en gran medida). En resumen, las diferen- 
cias en ambiente parecieron causar muy poca 
divergencia en los Cl de pares de gemelos iddn- 
ticos criados por separado. Estas conclusioncs 
corroboran una contribucidn gendtica a la inte- 
ligcncia, con una hereditabilidad cstimada que 
se cncuentra cerca del .70. 


Se puede ilustrar aun mds el impulso gene¬ 
ral de la investigacidn en esta drca con un estu¬ 
dio tfpico, el nuevo andlisis que realizd Honzik 
(1957) con los datos del estudio sobre adop- 
ci6n de Skodak y Skcels (1949). Este andlisis 
mucstra que cuando los nihos adoptados se 
someten varias veces a prueba con un inslru- 
mento como la Slanford-Binct, su inteligencia 
se correlaciona cada vez mds con los logros edu- 
cativos de sus padres bioldgicos; para los ocho 
aftos de edad, la corrclacidn sc cstabiliza en un 
valor aproximado de 0.35 (figure 7-8). Es muy 
interesante que dste cs aproximadamente cl 
mismo nivel de correlacidn que se cncuentra 
entre el Cl de los nifios y los logros cducativos 
de sus padres en familias intactas. En contras- 
te, Honzik (1957) determind que la inteligen¬ 
cia de los ninos adoptivos se correlaciond en 
casi cero con los logros cducativos de sus pa¬ 
dres adoptivos. Los logros educativos de los 
adultos constituyen una buena representacidn 
de su inteligencia—el mejorestimadodisponi- 
blc bajo las circunstancias. Los resultados in- 


Educaci6n del psdro on roloclon con el Cl dol nlflo 



Nota: Los datos de las madres son bastante similares. 

Flgura 7-8. Semejanza det Cl de ninos adoptivos con sus padres sustitutos y biologicos. 

Puente: Reproducido con autorizacidn de: Honzik, M. (1957). Developmental studies of parent-child resemblance In 
ratflgenco. Child Development, 28, 215-228. Copyright © de The Society for Research in Child Development, Inc. 









304 • Evaluation psicologlca: Historla, prindpios y apllcaclones 


(Capitulo 


dicaron que la inteligencia dc los hijos adop- 
tivos es aniloga a la inteligencia dc sus padres 
bioldgicos— incluso en su ausencia —pcro no 
muestra relacidn con la inteligencia de los padres 
adoptivos— incluso con su presencia constante 
y colidiana. significan estas conclusiones? 
Se sabe que los padres bioldgicos proporcio- 
naron la contribucidn genitica a la inteligencia 
de sus hijos, mientras los padres adoptivos apor- 
taron la fundamentacidn ambiental. El obser- 
vador desapasionado encontrara diffcil evitar 
una conclusidn obvia: los estudios sobre adop- 
cidn como el presentado por Honzik (1957) 
corroboran una contribucidn gcndtica conside¬ 
rable —pero no exclusiva— a la inteligencia. 

Sin embargo, se dcbe evitar la tendencia a 
considerar cualquier conjunto de investigacio- 
nes con una mentalidad simplista de una cosa o 
la otra. Incluso el tedrico mis apegado a la ex- 
plicacidn hereditaria rcconoce que la inteligen¬ 
cia de una persona sc moldea tambidn con base 
en el tipo de experiencia. La pregunta funda¬ 
mental es: £a qud grado cs que los ambientes 
cnriquecidos o de privacidn pueden aumentar 
o disminuir la inteligencia con respccto al po- 
tencial circunscrito a la gendtica? Se recucrda 
al lector que la contribucidn gendtica a la inte¬ 
ligencia cs indirecta, y con mayor probabilidad 
ocurre a travds de cstructuras fisicas del ccrebro 
y sistema nervioso codificadas a nivel gendtico. 
No obstante, cl ccrebro es bastantc malcable 
ante las manipulaciones ambicntalcs, las cua- 
les pueden aun altcrar su peso y la profusion de 
las redes neuronales (Greenough, Black y 
Wallace, 1987). ^Cuinto pueden cambiar di- 
chos impactos ambientalcs la inteligencia como 
se midc a travds dc pruebas de Cl? Se revisarin 
varios estudios que indican que los exlremos 
ambientales pueden ayudar a determinar el re- 
sultado intclcctual dentro de un rango dc aproxi- 
madamente 20 puntos dc Cl y quizi mis. 

EFECTOS AMBIENTALES: 
EMPOBRECIMIENTO Y 
ENRIQUECIMIENTO 

En primer lugar, se analizarin los efcctos dc las 
desventajas ambientalcs. Vernon (1979, capf- 


lulo 9) ha revisado los pnmeros estudios sobre 
pnvacidn grave y senala que los ninos criados 
bajo condiciones en las que luvieron poco o 
ningun contacto humano pueden mostrar nota- 
bles mejorfas en Cl (30 a 50 puntos) cuando se 
les transfiere a un ambiente mis normal. No 
obstante, se debc ver con escepticismo este coo- 
junto de investigacioncs, debido a las condi- 
ciones tfpicamcnte inusitadas en las que se 
aplicaron las pruebas iniciales. i.Sc puede apli- 
car una prueba significative a nifios de sicte anas 
criados casi como animates (Koluchova, 1972)? 

Tfpico de estas primeras investigaciones es 
el estudio de seguimiento de Skeels (1966) con 

25 nihos hudrfanos a los que en un principio se 
les diagnoslied retraso mental (Skeels y Dye, 
1939). Estos nifios se evaluaron inicialmcntc 
cuando tenfan cerca dc un afio y medio de edad 
mientras vivfan en un orfanatorio en el que se 
les daba muy poca estimulacidn. A 13 de ellos 
se les transfirid a otro hogar, donde rccibieron 
atcncidn supervisada y afectuosa dc parte de 
niftas con retraso mental de mayor edad. Es¬ 
tos nifios mostraron un aumento considerable 
en Cl, mientras los 12 que permanccicron en el 
lugar original tuvieron una disminucidn adicio- 
nal. Cuando se les rastred para el seguimiento 

26 ahos despues, los 13 casos transferidos eran 
adultos normales, que sc mantenfan por sf so¬ 
los y que estaban casados. Los otros se encon- 
traban todavfa institucionalizados o en trabajos 
humildes. El grupo con enriquccimiento ambien 
tal mostrd un aumento promedio de 32 puntos 
dc Cl cuando se les reevalud con la Stanford- 
Binet, mientras el grupo de contraste cayd con 
respecto a sus caliHcaciones originales. Aun- 
que no nos inclinamos a darle mucha credibili- 
dad a las calificaciones originales de Cl y, por 
tanto, se podrfa discrepar de la magnitud exac- 
ta del cambio, el estudio dc Skeels (1966) indi- 
ca con toda seguridad que la diferencia entre 
un ambiente inicial dc privacidn grave y uno 
mis normal podrfa explicar quizi de 15 a 20 
puntos de Cl. 

Jensen (1977) presenta una dcmostracidn 
metodoldgicamente novedosa de un deficit en 
cl Cl inducido por el ambiente. Este investig*- 
dor examind a 653 ninos dc raza blanca y a 826 
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n jfios afrocstadounidenses de una pequena po- 
blacidn rural en la parte sudoriental de Georgia. 
La hipdtesis altema de este estudio era quc los 
ninos afrocstadounidenses de mayor edad ten¬ 
don calificacioncs mis bajas que sus hernia- 
nos menores, debido a los efectos acumulativos 
y re ductores del intelecto de su ambiente in- 
l,5spito y de profunda privacidn. Segun la hi- 
pdtesis del deficit acumulativo, los cfectos 
acumulativos de las desvcntajas ambientales cn 
las factores relacionados con cl dcsarrollo mental 
dan por resultado una tendencia a la disminu- 
cidn consistente del Cl. En contraste, los niiios 
de raza blanca, quc tienen mcnos privaciones 
ambientales, no deberfan mostrar un deficit 
acumulativo intelectual como una funcidn li¬ 
neal de la edad. 

A todos se les aplicd la California Test of 
Mental Maturity (Prueba California de Madu- 
rcz Mental; CTMM, revisidn de 1963), una 
prueba estandarizada de la inteligencia general, 
como parte de un programa estatal obligatorio 
dcevaluacidn. La CTMM produjocalificacio- 
nes de Cl de dcsviacidn estandarizadas de ma- 
nera cuidadosa (media nacional de 100, des- 
viacion estandar de IS) que se calcularon por 
separado de las normas nacionales para cada 
nivcl desde el jardfn de niflos hasta bachillerato. 
Jensen (1977) senaldque las poblaciones mues- 
treadas, en particular el grupo afroestadouniden- 
sc, no tenfan el propdsito de ser representativas 
de la poblacidn general de EUA, ya fuera de 
raza blanca o de afrocstadounidenses: 

Es probable que las personas de raza negra en 
la localldad bajo estudio se encuentren en una 
situacion de desvenlaia tan grave, a nivel educa- 
ttvo y economico, como la que pudiera encon- 
trarse en cualquier parte de EUA. Si en este gru¬ 
po no existe una disminudbn con la edad, pare- 
cerfa muy dudoso que pudiera enoontrarse en 
cualquier subpoblacion denlro de nuestras fron- 
(eras. 

Como se pronostied, los ninos afroestadouni- 
denses de mayor edad obtuvieron calificacio- 
nes inferiores a las de sus hermanos menores y 
la magnitud de la difercncia se rclaciond de 
fnanera dirccta con la difcrencia cn edad. En 
Particular, los ninos afroestadoumdenses pare- 


cieron perder, en promedio, aproximadamente 
un punto de Cl por ano entre los 6 y 16 afios de 
edad, con una perdida acumulati va total de 5 a 
10 puntos de Cl. La cantidad exacta de la pdr- 
dida depende de la manera en que se interpre- 
ten algunas peculiaridades aparentes de la 
muestra en los datos (figura 7-9). Adem&s, si 
se incluye en el andlisis cl probable ddficit de 
Cl que haya ocurrido entre el nacimiento y los 
cinco anos de edad, se puede conjeturar que el 
efecto total de la privaci6n ambiental es sustan- 
cialmente mayor que la disminuci6n de 5 a 10 
puntos de Cl que inform6 Jensen (1977). 

Scarr y Weinberg (1976, 1983) revirticron 
la pregunta realizada por Jensen (1977): £qud 
sucede con la inteligencia de los ninos afroes- 
tadounidenses cuando familias de raza blanca 
quc poscen mayorcs rccursos ccondmicos y 
cducativos los adoptan dentro de un ambiente 
relativamente enriquecido? Como se analiza 
despu6s, es bien conocido que los nifios afroes- 
tadounidenses criados por sus propias familias 
obtienen calificacioncs de Cl quc promedian 
cerca de 15 puntos por debajo de los Cl de los 
de raza blanca (Jensen, 1980). Es probable que 
una parte de esta diferencia —y quiza loda— 
se deba a las muchas diferencias sociales, eco- 
ndmicas y culturales entre estos dos grupos. Por 
el momento, se hace a un lado este asunto y en 
su lugar se atenderd a una pregunta que tiene 



■ lot hermanos 


Figura 7-9. Diferencia promedio en el Cl en la CTMM 
entre hermanos afroestadounlderises menores y ma- 
yores en funcion de la diferencia en edades. 

Fuente: Basado en datos de Jensen, A.R. (1977). 
Cumulative deficit in IQ of blacks In Ihe rural south. 
Developmental Psychology. 13, 184-191. 
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quc vcr con la maleabilidad del Cl: £se logra 
alguna diferencia cuando sc adopta a los ninos 
afroestadounidenses dentro dc un ambiente con 
mayores ventajas econdmicas y educativas? 

Scarr y Weinberg (1976, 1983) enconlra- 
ron que 130 nifios afroestadounidenses e interra- 
ciales, adoptados por familias de clasc media 
alta, promediaron un Cl Total de 106 puntos en 
la Stanford-Binet o el WISC, seis puntos por 
encima del promedio nacional, y entre 18 y 21 
puntos por arriba de las calificaciones que por 
lo comiin se encuentran con individuos afroes¬ 
tadounidenses. Los ninos afroestadounidenses 
adoptados antes del afio dc edad tuvieron rcsul- 
tados que incluso fueron mejores, con un Cl 
promedio de 110 puntos. S6lo podrfa uno pre- 
guntarse cuiles habri'an sido las calificaciones 
dc Cl si las adopciones hubieran ocurrido al 
nacer y si se hubiera proporcionado excelente 
cuidado prenatal. Este estudio indica que cuan¬ 
do el ambiente inicial es 6ptimo, el Cl puede 
elevarse en, tal vez, 20 puntos. 

Ademis de enriquecerel ambiente psicoltS- 
gico, otro enfoque para incrementar el Cl ha 
consistido en mejorarel nivel nutricional de los 
ninos. Un estudio de Schoenthaler, Amos, 
Eysenck y colaboradorcs (1991) examind los 
efectos de los complementos de vitaminas-mi- 
ncrales sobre cl Cl de 615 estudiantes de edu- 
cacidn media. Excepto por el hecho de que se 
utilizd un disefio experimental extradamente 
cuidadoso con asignacidn aleatoria doble cic- 
go, sen a ficil descartar este estudio como una 
investigacidn “charlatana” sobre la improbable 
hipdtesis de que 12 semanas de enriquecimien- 
to con vitaminas y mineralcs elevarfa el Cl. Los 
investigadores encontraron quc. en compara- 
ci6n con un grupo control que recibid un 
placebo, los ninos que recibieron 100% de los 
complementos diarios recomendados de vita- 
minas/minerales no mostraron aumento en el 
Cl Verbal, pero sf una elevacidn de 3.7 puntos 
en el Cl de Ejecucidn del W1SC-R. Este resul- 
tado requiere que otros investigadores lo repli- 
quen y extiendan. Lynn (1993) re visa estudios 
adicionales, incluyendo una ganacia informa- 
da de nueve puntos de Cl en razonamiento no 
verbal entre ninos que recibieron un comple- 


mento de vitaminas-minerales durante un pe. 
riodo de ocho meses. 

Las limitaciones de espacio impiden una 
discusidn mis detallada de los efectos ambien- 
tales sobre el Cl. No obstante, cs necesario 
mencionar quc ha surgido gran cantidad de bi- 
bliograffa a partir de los primeros estudios 
de intervencidn y enriquecimicnto-cslimulaci6n 
con nifios que estin en riesgo de fracaso esco- 
lar y retraso mental (p. ej., Ramey y Ramey, 
1998; Spitz, 1986; Sprigle y Schaeffer, 1985). 
En general, estos estudios muestran que la in¬ 
tervencidn y el enriquecimiento pueden clevar 
el Cl de ninos que estin en riesgo de fracasar 
en la escuela o sufrir retraso mental. En un re- 
sumen de cuatro decenios dc investigacidn, 
Ramey y Ramey (1998) extrajeron seis princi- 
pios de la investigacidn sobre intervencidn tem- 
prana con nifios en situacidn de riesgo. Estos 
autores los definen como “consistcncias nota¬ 
bles en las principales conclusiones" de los es¬ 
tudios de investigacidn: 

1. Las intervenciones que comienzan tempra- 
no (p. ej., durante la lactancia) y continuan 
por mis tiempo, proporcionan los mejores 
beneficios a los nifios participantes. 

2. Las intervenciones mis intensivas (p. ej., 
numero de visitas por semana) producen 
efectos positivos mis amplios que las me- 
nos intensivas. 

3. Las experiencias directas dc enriquecimien¬ 
to (p. ej., el trabajo directo con los niflos) 
proporcionan mayor impacto que las expe¬ 
riencias indirectas. 

4. Los programas con servicios complctos 
(p. ej., mejorfas multiples) producen mayo¬ 
res cambios positivos que aquellos con un 
enfoque estrecho. 

5. Algunos ninos (p. ej., aquellos con peso nor¬ 
mal al nacer) muestran mayores beneficios 
de la participaci6n que otros. 

6. Los beneficios iniciales positivos disminuyen 
a lo largo del tiempo si el ambiente del nino 
no estimula las actitudes positi vas y el apren- 
dizaje continuo. 

Una preocupacidn acerca de los programas de 
intervencidn temprana es su costo, que ha sido 






Sesgo de una prueba y examen de poblaciones especiales •307 


excesivo para algunos proyectos de demostra- 
c j<5n. Los escdpticos ticncn dudas acerca de 
|os aspcctos practicos y, tambidn, sobre la ga- 
nancia de proporcionar intervencidn continua, 
extensa y con una base amplia, casi desde el 
nacimiento para millones dc ninos que estin en 
riesgo dc presentar problcrnas del desarrollo. 
£sta es una preocupacidn realista porque "rela- 
uvamente pocos programas de intervencidn 
temprana han tenido un seguimiento a largo 
plazo" (Ramey y Ramey, 1998). Los crfticos 
tambien se preguntan si los programas lan s6lo 
le cnsenan a los ninos la mancra cn que se realiza 
una prueba sin afectar mucho su i ntcl igencia sub- 
yacenic (Jensen, 1981). Por ultimo, esti la cues- 
lidn de la congruencia cultural. Los programas 
de intervencidn han sido diseiiados principal* 
mentc por psicdlogos de raza blanca y despuds 
se aplican de manera desproporcionada a ni- 
ilos de minorfas. £sta es una preocupacidn de- 
bidoaque los programas deben ser cultural mentc 
pertincntes y aceptables para los consumido- 
res, de otro modo las intervenciones cstin con- 
denadas al fracaso. 

EFECTOS TERATOGENICOS SOBRE 
LA INTEUGENCIA Y EL DESARROLLO 

En cl desarrollo normal prenatal, el feto se en- 
cuentra protegido del ambicnte exterior por la 
placenta, que es un drgano vascular dentro del 
litero a travds del cual se nutre al embridn. No 
obstante, algunas sustancias conocidas como 
teratdgenos atraviesan la barrera placentaria y 
provocan deformidades ffsicas en el feto. Si 
dstas se presentan cn el ccrcbro, principalmen- 
le, pueden producir trastornos conductuales 
durante el resto de la vida, que incluyen bajo Cl 
y retraso mental. La lista de teratdgenos poten- 
cialcs es casi infinita e incluye mcdicamentos, 
hormcnas, drogas ilfeitas, tabaco, alcohol, ra- 
diacidn, qufmicos tdxicos e infecciones vitales 
(Berk, 1989; Martin, 1994). Se destacari de 
manera breve al mis frecuente de los tera- 
Idgenos, el alcohol, que tambidn es el mis fdcil 
de prcvenir. 

El consumo excesivo de alcohol en muje- 
res embarazadas causa que sus hijos estdn en 


muy alto riesgo de sufrir el sindromc alcoho- 
lico fetal (SAF), que es un conjunto espeeffi- 
co de anormalidades que describieron 
initial mentc Jones, Smith, Ulleland y Streissguth 
(1973). Los nifios con SAF tienen una inteli- 
gencia notablemente mcnor; cuando se les eva- 
lua en la adolesccncia o la edad adulta, ccrca de 
la mitad se encuentra dentro del rango de retra¬ 
so mental en pruebas de Cl (Olson, 1994). La 
exposicidn prenatal al alcohol es una de las prin¬ 
cipals causas dc retraso mental que se cono- 
cen en el mundo occidental. Los criterios que 
definen al SAF incluyen: 

1. Retraso en el crecimiento prenatal, posnatal 
o ambos —peso menor al percentil 10 despuds 
de hacer la correccidn para edad de gestacidn. 

2. Disfuncidn del sistema nervioso central —de- 
formaciones de erdneo o ccrcbro, retraso 
mental de levc a modcrado, anormalidades 
neuroldgicas y problemas de conducts. 

3. Dismorfologfa facial —espacio amplio entre 
los ojos, pequeha apertura entre los piirpa- 
dos, nariz pequeha y respingada, labio supe¬ 
rior delgado y deformidades menores en las 
orejas (Clarrcn y Smith, 1978; Sokol y 
Clarren, 1989). 

El SAF completo que se describe antes ocurre 
principalmente en los hijos dc mujeres alcohd- 
lieas —aquellas que consumcn muchas bebi- 
das cn cada ocasidn. Con menores niveles de 
ingestidn de alcohol puede surgir una manifes- 
tacidn mds leve del sindromc conocida como 
efecto alcohdlico fetal. Por lo comdn, un niflo 
con cstc efecto tiene una apariencia ffsica nor¬ 
mal, pero exhibc problemas evidentes en su 
capacidad de atencidn y es mis lento para res¬ 
ponder en un paradigms de tiempo de reaccidn 
(Streissguth, Martin, Barr y Sandman, 1984). 
Adcmis, el efecto es lineal en relacidn con la 
dosis; es decir, puede ser que no exista un nivel 
seguro de ingestidn de alcohol durante el em- 
barazo (Streissguth, Bookstein y Barr, 1996). 
Por tal razdn, en la actualidad los mddicos suelen 
recomendar la abstencidn del alcohol durante 
el embarazo. 

No obstante, un conservador cstimado de 
la incidencia del SAF (formas leves a graves) 
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en el mundo occidental cs dc 1 por cada 1 000 
nacimientos vivos, donde la mayor parte de los 
casos qucdan sin diagnosticar o reconoccrse 
(Abel, 1995). Spohry Steinhausem (1996) pro- 
porcionan una excelcnte resefia de la investi- 
gacidn acerca del SAF. 

EFECTOS DE LAS TOXINAS 
AMBIENTALES SOBRE LA INTEUGENCIA 

Muchos qufmicos y subproductos industriales 
pueden alterar temporalmente el sistema ner- 
vioso o incluso causar dafios permanentes que 
afectan la inteligencia. Algunos ejemplos inclu- 
yen el plomo, mercurio, manganeso, arsenico, 
talio, tetraetilo dc plomo, compuestos orgdni- 
cos dc mercurio, bromuro de mctilo y bisulfuro 
de carbono (Lishman, 1978, capftulo 13). Con 
seguridad, la mis estudiada dc cstas toxinas am- 
bientales es el plomo, el cual se analiza aquf 
brevemente. 

Las fuentcs de absorcidn de plomo cn 
humanos incluyen: ingestidn de pintura con 
pigmentos de plomo en lactantes e infantes; 
aspiracidn de partfculas de plomo de las emi- 
siones de fundiciones o de la combustidn de 
gasolinas con plomo en los automdviles; inges¬ 
tion de comida dc latas con soldadura dc plo¬ 
mo o de cerdmica con glaseado de plomo c 
ingestidn de agua que ha pasado por tuberfas 
de plomo. Dado que cl cuerpo humano secrcta 
cl plomo de mancra lenta, la mayorfa de las 
personas en pafses industrializados llcvan una 
carga dc este metal sustancialmcnte mayor 
—quizd 500 veces mis alta— que la conocidu 
en tiempos anieriores a Roma (Patterson, 1980). 

Cualquier investigador medico y psicold- 
gico que haya estudiado este tema reconoce los 
peligros del alto nivel de exposicidn al plomo; 
las altas dosis se vinculan de manera irrefu¬ 
table con la pardlisis cerebral, trastomos epi- 
ldpticos, ceguera, retraso mental e incluso la 
muerte. La pregunta mis importantc ticnc que 
ver con la exposicidn “asintomdtica” al plomo: 
£un nivel de absorcidn insuficiente para provo- 
car sfntomas medicos evidentes puede producir 
de todas maneras una disminuci6n en las capa- 
cidades intclectuales? 


Las conclusiones de la invcstigacidn sobre 
cl tema son complejas y poldmicas. Al utilizar 
como fndice de acumulacidn el plomo encon. 
trado cn los dientes de leche mudados por ninos 
pequeiios, Needleman, Gunnoe, Leviton, Reed, 
Peresie, Maher y Barrett (1979) informaron que 
la cxposicidn asintomdtica al plomo se relaciona- 
ba con disminuciones en la inteligencia general 
(cerca dc 4 puntos de Cl) y con un desempedo 
menor en subpruebas verbales, pruebas de pro- 
cesamiento auditivo y del habla y en una medida 
de atencidn con base en el tiempo de reaccion. 
Estas diferencias persisticron 11 ados despuds 
(Needleman, Schell, Bellinger, Leviton y 
Allred, 1990). No obstante, al utilizar un mdto- 
do de cstudio similar, Smith. Delves, Lansdown, 
Clayton y Graham (1983) encontraron un cfecto 
no significativo de la exposici6n de los nifios 
al plomo cuando se controlaron los factores de 
nivel educativo de los padres y nivel social. 

Las conclusiones de la investigacidn sobre 
este tema son contradictorias, en parte, debido 
a que es diffcil separar los efectos del plomo de 
aqudllos de la pobreza, estrds, nutricidn defi- 
cicnte y otras variables que producen confu- 
sidn (Gregory y Mohan, 1977). Es mds probable 
que la exposicidn asintomdtica al plomo tenga 
efectos daninos sobre el sistema nervioso cen¬ 
tral que se traduzcan en reduccidn de la inteli- 
gcncia, dificultades de atencidn y en una multitud 
de consecucncias conductualcs indcscablcs, 
Aunque los cientfficos no coincidan sobre este 
punto, se recomienda reducir al menor nivel po- 
siblc la cxposicidn al plomo en humanos. 

I ORIGENES DE LAS DIFERENCIAS 
m DE a ENTRE PERSONAS 
AFROESTADOUNIDENSES 
l | Y DE RAZA BLANCA 


DIFERENCIAS DE a ENTRE PERSONAS 
AFROESTADOUNIDENSES Y DE RAZA 
BLANCA 

Como se sehalo antes, los afroestadounidcnscs 
oblienen, en promedio, cerca de 15 puntos me- 
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nos en pruebas dc Cl que los estadounidenses 
de raza blanca. La difercncia no es trivial, ya 
que casi alcanza una desviacidn cstAndar com- 
pleta. Aunque la diferencia en Cl flucttia de un 
anilisis a otro —tan pcqucna como 10 puntos 
en algunos estudios, pero tan grande como 20 
puntos en otros—, la disparidad se ha documcn- 
lado con numerosas muestras y con una amplia 
variedad dc pruebas. El control de la variable 
de clasc social reduce la diferencia, pero no la 
elimina. Lo que es mds. la magnilud dc la dife¬ 
rencia parece habcr permanecido inmune al 
cambio desdc mcdiados hasta finales del siglo 
XX (Jensen, 1980; Kennedy, Van de Riet y 
White. 1963; Shuey, 1966). 

La figura 7-10 presenta uno de los prime- 
ros estudios sobre las difcrencias entre perso¬ 
nas afroestadounidenscs y dc raza blanca que 
se basd en la edicidn de 1960 dc la Stanford- 
Binct. El lector observard que, en promedio, la 
muestra dc raza blanca (A/ = 101.8) tuvo califi- 
cacioncs mas alias que la muestra afroestado- 


unidense (M = 80.7) en cerca dc 20 puntos dc 
Cl. Recicntemcnte ha surgido un patrdn simi¬ 
lar con el WAIS-R, donde la muestra de 
cstandarizacidn de individuos de raza blanca 
(A/ = 101.4) tuvo calificacioncsmayorcscn 14.5 
puntos de Cl que la muestra de personas 
afroestadounidenscs (M = 86.9) (Reynolds, 
Chastain, Kaufman y McLean, 1987). La dife¬ 
rencia racial lambiln surgid en Stanford-Binct: 
Cuarta Edicidn actualizada, donde las individuos 
dc raza blanca (M - 103.5) dentro dc la mucs- 
tra de estandarizacidn obtuvieron calificacio- 
nes mils alias que los afroestadounidenses 
(M - 86.1) en casi 17.5 puntos (Thorndike, 
Hagen y Saltier, 1986). 

Cuando se toman en cuenta variables de- 
mogrdficas como el nivel socioecondmico, cl 
tamaho de la diferencia promedio se reduce dc 
.5 a .7 desviaciones cstdndar o dc 7 a 10 pun¬ 
tos de Cl pero permanece constantc (Reynolds 
y Brown, 1984a). La veracidad dc una diferen¬ 
cia racial cn calificaciones de Cl se ha replicado 



rigura 7-10, Distribuciones de Cl de la Stanford-Binet para estadounidenses de raza negra y blanca. 

Fuente: Reprodocido con autorizaciOn de Kennedy, W. A. Van de Rlet, V. y White. Jr„ J. C. (1963). A normative 
•ample ol Intelligence and achievement ot negro elementary school children in the southeast United States. 
Monographs of the Society for Research in Child Development, 28 [No. 90), 68. Copyright © do la Society tor 
Research in Child Development, Inc. 
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cn tantas ocasiones que ya no constituyc un 
punto de disputa seria. No obstante, la Inter¬ 
pretation de estas conclusioncs bien documen- 
tadas se debate con vehemcncia. 

Un punto de vista (que se analizd antes) es 
que la disparidad observada cn el Cl es produ- 
cida, cn parte o totalmente. por el sesgo de una 
prueba. Es una perspectiva que se sostiene de 
manera amplia a nivel popular y que, como se vio 
antes, en pocas ocasiones tiene apoyo de los 
estudios tbcnicos sobre cl sesgo de una prueba. 
feste puede representar una funcidn menor en 
las diferencias raciales, pero no puede cxpli- 
car las diferencias grandes y pesistentes en ca- 
lificaciones de Cl entre estadounidenscs de raza 
blanca y de origen africano. En este caso se in- 
tenta examinar una hipdtesis diferente: £la di- 
ferencia entre estadounidenscs de raza blanca 
y de origen africano es principalmcnte gendtica? 


HIPOTESIS GENET!CA 

DE LAS DIFERENCIAS RACIALES EN O 

La hipdtesis de la base gendtica de las diferen¬ 
cias raciales en Cl obtuvo inicialmente impor- 
tancia acaddmica en 1969, cuando Arthur 
Jensen publied un artfculo intitulado “^Cudnto 
podemos elevar el Cl y el rcndimiento csco- 
lar?” (Jensen, 1969). Jensen cstableci6 el tono 
de su artfculo en la oracidn introductoria cuan¬ 
do afirmd que “se ha hecho el intento de pro- 
porcionar cducacidn compensatoria y en 
apariencia esto ha fallado". Ademds, este autor 
expresd que los programas de educaci6n 
compensatoria sc basaban en dos fundamentos 
te6ricos engaflosos: el "concepto del nifio pro- 
medio", que considera a los niftos como m&s o 
menos homogdneos. y la “hipdtesis de la priva- 
ci6n social", que afirma que la privaci6n am- 
bicntal es la principal causa de la disminucidn 
en rendimiento y en calificaciones de Cl. Jensen 
adoptd una postura firme en contra de ambas 
suposiciones. Lo que es mds, basdndose prin- 
cipalmente en la bibliograffa sobre gendlica 
conductual, Jensen implic6 que la raz6n por la 
que los individuos de raza blanca tenfan califi¬ 
caciones m&s alias que los afroestadounidenscs 


en pruebas de Cl estaba relacionada probable- 
mente mfis con factores gendticos que con los 
efectos de la privacidn ambiental. La idea gene- 
ral de su artfculo era la de sugerir que, dado que 
la cducaci6n compensatoria ha rcsultado ine- 
ficiente y debido a que la cvidencia sugiere que 
existe un fuerte componente gendtico relacio- 
nado con cl Cl, serfa apropiado considcrar una 
explicacidn gendtica para la difercncia bien 
documentada en favor de los individuos de raza 
blanca en las pruebas de Cl. Jensen formuld 
la hipdtesis gendtica de una manera cuidadosa, 
tentativa y acaddmica: 

El hecho de que una hipdtesis razonable no sa 
haya probado de manera rlgurosa no sign Mica 
que se le deberla rechazar de Inmediato; sbto que 
se neceslta investlgaclbn mis apropiada para po- 
neilo a praeba. Corvsidero que tal Investlgaclbn 
definitive es totalmente poslble, pero no se ha 
hecho. De modo que nos quedan varias tineas 
de evldencla, nlnguna de las cuales es definitiva 
por sf sola, pero que, vistas en conjunto, hacen 
que sea razonable la hlpbtesis de que los facto¬ 
res genbticos tlenen una fuerte participacidn 
en la dlferencla promedlo en Inteligencla entre 
personas de raza negra y blanca. La preponde¬ 
rance de la evldencla es, en ml oplnkbn, menos 
conslstente con una hlpbtesis estrictamente am¬ 
biental que con una genbtica, locual, por supues- 
to, no excluye la influencla del amblente o su 
interaccibn con los factores genbtlcos (Jensen, 
1969 ). 


A1 proponer una hipdlesis gcndtica para las di¬ 
ferencias cn Cl, Jensen provoed un intenso de¬ 
bate que se ha perpetuado, con breves pausas, 
hasta nuestros dfas. 

A mediados del dccenio dc 1990, la con- 
troversia sobre las bases gendlicas de las dife¬ 
rencias raciales se intensified una vez mds con 
la publicacidn de The Bell Curve, escrito por 
Richard Hermstein y Charles Murray (1994). 
Este libro se referfa principalmente a la impor- 
tancia del Cl como medio de prediccidn de la 
pobreza, abandono escolar, desempleo, pater- 
nidad ilegftima, delincuencia y otras patologfas 
sociales. Pero dos capftulos sobre las diferen¬ 


cias dlnicas en inteligencia provocaron una pro- 
testa general entre los cientfficos sociales y el 
publico lego. Los autores revisaron docenas de 
estudios y concluyeron que la brccha cn Cl 
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erttre personas afrocstadounidcnses y de raza 
blanca habfa cambiado poco en este siglo. Tam- 
biin discutieron que el sesgo de una prueba no 
podia explicar las diferencias raciales. Lo que 
e $ mis, senalaron que las razas no s61o diferfan 
e n las calificaciones promedio de Cl. sino tam- 
bi6n en el perfil de capacidades intclectuales. 
AdemAs, concluyeron que la imeligencia sdlo 
puede modiftcarse de manera limitada. incluso 
con una intervencidn ambiental intensiva. A1 
igual que Jensen. Hermstein y Murray (1994) 
enpresaron su hipdtesis gendtica con mucho 
cuidado: 

Nos pareco sumamonte probable que tanto la 
gendtica como el ambienle tlenen algo que ver 
con las dilerenclas raciales [on capacidad 
cogrviUva). iCudl podrla set la composlcidn? Nos 
mostramos resueltamente agndsticos al respec- 
to: hasta doode podemos determinarlo, la evl- 
dencia no justifies todavia un ostlmado. 

Aunque los autores declinaron proporcionar un 
estimado de la contribucidn gendtica a las dife¬ 
rencias raciales en Cl. es claro. por el tono 
pesimista de su libro, que lo considcran sustan- 
cial. iTal conclusidn tiene fundamcntacidn con 
base en laevidencia? 

VALIDEZ DE LA H1POTESIS GENET1CA 

La hipdtesis gendtica de las diferencias raciales 
en Cl es una idea poco comdn que muchos 
legos y cientfficos sociales consideran anate- 
ma, pero esto no significa ninguna objecidn, y 
la superficialidad no sustituye a un examen ra- 
zonado de la evidcncia. Ante los resultados de 
anilisis e investigacidn adicionales, its vdlida 
la hipdtesis gendtica para las diferencias en Cl? 
Aquf sc examinardn tres Uneas de evidencia que 
indican que la respucsta es “no”. 

Varios crfticos han scflalado que la hipdte¬ 
sis gendtica se basa en la suposicidn cucstiona- 
ble de que la evidencia de la hereditabilidad 
del Cl dentro de los grupos puede utilizarse para 
inferir la hereditabilidad entre grupos raciales. 
Jensen (1969) expresd csta premisa de manera 
b&stante cxplfcita al destacar que el componente 


gendtico sustancial en el Cl es una evidencia 
sugerente de que las diferencias en dste entre 
estadounidenses de raza blanca y de origen 
africano tienen, en parte, una base gendtica. 
Haciendo eco de crfticos anteriores, Kaufman 
(1990) responde como sigue: 

No puede Inferirse la hereditabilidad entre gru¬ 
pos a partlr de estudios que hayan proporciona- 
do evidencia de la hereditab*ldad del Cl dentro de 
estos. Incluso si el Cl se heredara por igual den¬ 
tro de las razas negra y blanca por separado, 
eso no prueba que las diferencias en Cl entre las 
razas tengan un origen gendtico. El servcRIo ejem- 
plo de Scarr-Salapatek (1971. p. 1226) explica 
muy bien este punto: plante en dos tipos de sue- 
lo —coodiciones buenas contra condiciones po- 
bres— dos muestras de semillas elegldas de 
manera aleatoria de una poblackin gendticamente 
heterogdnea y compare la altura de las plantas 
completamente crecidas. Dentro de cada tipo de 
sueto, las variaciones individuales en altura se 
determinan de manera gendtica; pero la diferen- 
da promedio en altura entre las dos muestras 
estb sdlo on funcidn del ambiente. 

Un segundo problema con la hip6tesis gendtica 
es que una prediccidn importanle derivada de 
clla no se sostiene ante el examen empfrico. En 
tdrminos especfftcos, si las diferencias raciales 
en Cl tienen una base gendtica, entonces cl gra- 
do de ascendencia africana deberfa ayudar a 
pronosticar los Cl promedio dentro de los 
subgrupos afroestadounidenses. En otras pala- 
bras. los afroestadounidenses con ascendencia 
lolalmente africana deberfan tener, en prome¬ 
dio, calificaciones menorcs en pruebas de Cl 
que los afroestadounidenses con una mezcla de 
ascendencia africana y caucdsica. No obstante, 
al utilizar marcadores sangufneos de grupo 
como fndice de la mezcla negra-caucfisica, 
Scarr, Pakstis. Katz y Barker (1977) no encon- 
traron evidencia de una relacidn entre el grado 
de ascendencia blanca y las habilidades inte- 
lectualcs dentro de la poblacidn afrocstadouni- 
dense. Asf, sus resultados no sustentaron una 
fuerte hipdtesis de diferencias gendticas racia¬ 
les en inteligencia. 

Olra crftica de la hipdtesis gendtica es que 
el anAlisis cuidadoso de los factorcs ambienta- 
les proporciona una explicacidn suficientc de las 
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difcrencias raciales en Cl; es decir, la hip6tesis 
genetica es simplemente innecesaria. Gste es el 
enfoquc que toman Brooks-Gunn, Klebanov y 
Duncan (1996) en un estudio con 483 nifios 
afroestadounidenses y dc raza blanca con bajo 
peso al nacer. Lo que hace diferente a su estu¬ 
dio de otros analisis similares es la riqueza dc 
sus datos. En vez de utilizar s61o 1 o 2 medidas 
del ambiente (p. ej., un solo fndice del nivel de 
pobreza), obtuvieron datos longitudinales so- 
bre nivel dc ingrcsos y muchos otros factorcs 
relacionados con la pobreza, como el tiempo 
que sc pcrmancce en el hospital, capacidad veibal 
matema, ambiente de aprendizaje en el hogar, 
condiciones del vecindario y otros componentes 
de la clase social de la familia. Cuando se eva- 
Iu6 el Cl de los nifios a los cinco afios de edad 
utilizando el WPPSI, los investigadores encon- 
traron la frecuente disparidad entre los nifios de 
raza blanca (Cl medio de 103) y los afro¬ 
estadounidenses (Cl medio de 85). No obstan¬ 
te, cuando se controlaron la pobreza y sus fac- 
tores relacionados, las diferencias de Cl casi sc 
eliminaron por completo. Este estudio sugiere 
que las investigaciones anteriores habfan sub- 
estimado los profundos efectos de la pobreza y 
de sus factores relacionados como contribucidn 
a las diferencias de Cl entre personas afroesta¬ 
dounidenses y de raza blanca. Neisser, Boodoo, 
Bouchard y colaboradorcs (1996) ofrecen 
perspectivas adicionales sobre las diferencias 
racialcs en Cl y temas relacionados. 

Antes dc abandonar el tema de las diferen¬ 
cias raciales en Cl, se debe sefialar que la per- 
cepcion vinculada con este tema es, en gran 
medida, inmerecida por dos razones. Primero, 
los grupos raciales siempre han mostrado valo- 
res de Cl semejantes —lo cual significa que 
los pueblos de la tierra son mucho mas pareci- 
dos que diferentes. Segundo, como se sefiald 
antes, las diferencias raciales existentes cn cuan- 
to a Cl rcflcjan, con toda seguridad, diferen¬ 
cias culturales y factores ambientales en grado 
sustancial. Wilson (1994) ha catalogado las nu- 
merosas diferencias en antecedentes culturales 
entre los estadounidenses de origen europeo y 
africano. Porejemplo, en 1992, 64% de padres 


afroestadounidenses sc habfan divorciado, .se- 
parado, habfan quedado viudos o nunca sc ha¬ 
bfan casado; 63% de los nacimientos dentro de 
la comunidad afroestadounidense ocurrieron 
entre madres solteras y 30% de los nacimien¬ 
tos entre afroestadounidenses fucron dc ma¬ 
dres adolescentes (U.S. Bureau of the Census, 
1993). Estas dcsalcntadoras realidades de la 
vida familiar dc muchos afroestadounidenses 
deben traducirse, inevitablemente, en un dcs- 
empefio mcnorcn pruebas dc intcligcncia. Pero, 
con cl propdsilo de que el lector no concluya 
que se avala una forma sutil de superiondad 
anglocentrica, considerese la conclusidn de 
Lynn (1987) de que la media de Cl de los japo- 
neses es de 107, siete puntos por encima del 
promedio dc los individuos de raza banca cn 
EUA. £Y qud? 


CAMBIOS DE INTEUGENCIA 
CON LA EDAD 


Se volverd ahora la atencidn hacia otro tema 
poldmico: Ja inteligencia declina con la edad? 
Con seguridad, uno dc los estcreotipos mis 
generalizados acerca del envcjecimientoes que 
con dl se pierda capacidad intelectual. Esta idea 
esti tan extendida que pocos legos la cueslio- 
nan. Pero deberfa ponerse en duda. 

En general, cl estudio empfrico de este tema 
proporciona una conclusidn mis optimista dc 
la que sugiere el pensamiento comun. No obs¬ 
tante, la invcstigacidn tambidn rcvcla que los 
cambios en inteligencia relacionados con la 
edad son complejos y multifacdticos. La sim¬ 
ple pregunta de si “^la inteligencia declina con 
la edad?” resulta tener varias respuestas com- 
plicadas. 

Se puede seguir la evolucidn de la investi- 
gacidn sobre cambios intelectuales relaciona¬ 
dos con la edad dc la siguiente mancra: 

1. Las primeras investigaciones transversales 
con instrumentos como el WAIS pintaban 
un cuadro sombrfo de disminucidn lenta de 
la inteligencia general despues de los 15 o 20 
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afios de edad y de una cafda precipitada des- 
puds de los 60 afios. 

2. Sdlo pocos afios despuds, estudios mds com- 
plcjos que utilizaron prucbas secuenciales 
con mstrumentos multidimensionales (como 
|a Prueba de Habilidades Mentales Prima- 
rias) sugirieron una traycctoria mds optimista 
para la inteligencia: cambio mfnimo en la 
mayor parte de las capacidades hasta, cuan- 
do menos, los 60 afios de edad. 

3. La investigaci6n paralela que utilizaba la dis- 
tincidn lluida-cristalizada postuld un incre- 
mento gradual en la inteligencia cristalizada 
casi hasta el final de la vida, en yuxtaposi- 
cidn con una disminucidn rdpida en intcli- 
gencia lluida. 

4. Recientcmente, algunos psicdlogos han pro- 
puesto que la inteligencia del adulto es 
cualitati vamente diferente, similar a una nue- 
va etapa piagetiana que podrfa llamarsc ra- 
zonamiento posformal. Esta investigacidn 
pone en duda la validcz ecoldgica de em- 
plear instrumentos estandarizados con per¬ 
sonas de mayor edad. A continuacidn se 
analiza con mayor dctallc cada una de cstas 
etapas de invcstigacidn. 


PRIMERAS INVESTIGACIONES 
TRANSVERSALES 

Uno de los primeros estudios amplios acerca 
de las tendcncias con la edad en una prueba de 
inteligencia de aplicacidn individual fue el que 
presentd Wechsler (1944) poco despuds de la 
publicacidn de la Wechslcr-Bellevue Forma I. 
Como ocurre con todas las prucbas Wechsler 
disefiadas para adullos, las puntuaciones natu- 
ralcs en las subpruebas de la W-B l se transfor- 
maban primero en puntuaciones estdndar 
Iconocidas como puntuaciones escalares) con 
media de 10 y desviacidn estdndar de 3. Sin 
tomar en cuenta la edad de la persona, estas 
puntuaciones escalares sc basaban en un grupo 
fijode refercncia de 350 participantes enlre 20 
y 34 afios de edad incluidos en la muestra de 
wtandanzacidn. A1 consultar la tabla apropia- 
da por edad, la suma de las 11 puntuaciones 


escalares sc utilizaba para encontrarcl Cl de la 
persona evaluada. 

No obstante, la suma de las puntuaciones 
escalares en sf misma es un fndice directo de la 
capacidad de un individuo examinado en rela- 
cidn con el grupo de referenda. Wechsler utili- 
zd estc fndice para proyectar la rclacidn entre 
edad e inteligencia (figura 7-11). Sus rcsulta- 
dos indicaron un rdpido crecimiento en la inte¬ 
ligencia general durante la infancia hasta los 
15 o 20 afios de edad, seguido de una lenta dis- 
minucidn hasta los 65 afios. Wechsler se mos- 
tr6 caracterfsticamente contundente en la 
discusidn de sus conclusiones: 

Si el hecho de que el crecimiento Intelectual cesa 
aproximadamente a los 15 afios de edad ha sldo 
diticll do aceptar, un trago m6s amargo lo constl- 
tuye la Indicacibn de que la inteligencia, despuds 
de lograr su mdxlmo, comienza a dedinar de 
manera inmediata justo como cualquier otra ca¬ 
pacidad fisioldgica, en vez de mantenerse en su 
nivel mas alto durante un largo periodo. De he¬ 
cho. ha resultado tan desagradable, que los psi- 
cdlogos en general han evitado sefialarlo 
(Wechsler. 1952). 

Los estudios normativos con subsecucntcs prue- 
bas Wechsler para adultos revelaron justo el 
mismo patrdn, tanto en el WAIS (Wechsler. 

1955), el WAIS-R (Wechsler, 1981) y el WAIS-III 
(Tulsky, Zhu y Ledbetter, 1997). Investigado- 
res posteriores tambiln extendieron el Ifmite 
superior de edad sometido a prueba a los 70 y 
80 afios, cncontrando una tasa progresiva y ace- 
lerada de disminucidn en el desempefio gene¬ 
ral en una prueba que pareefa confirmar la 
crccncia de Wechsler de que era “normal" que 
la inteligencia general declinara despuds de la 
primera parte de la edad adulta (Eisdorfer y 
Cohen, 1961). 

Wechsler y muchos otros investigadores 
que emplearon cl diseiio transversal pasaron 
por alto la influencia de su metodologfa sobre 
sus datos. Durante algun tiempo se ha recono- 
cido que los estudios transversalcs suelcn con- 
fundir los efectos de la edad con disparidadcs 
cducativas o con otras diferencias entre grupos 
por edad (vdase Baltes, Reese y Nesselroade, 
1977; Kausler, 1991). Porcjcmplo, en los estudios 
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Flgura 7-11. Curva de crecimiento y supuesta dlsminucl6n an la Wechsler-Bellevue Forma I 
Fuente: Relmpreso con aulortzacldn de Wechsler, D. (1944). Measurement of adult Intelligence (3rd ed.). Baltimore, 
MO: Williams y Wilkins. 


normalivos de las pruebas Wechsler, es inva- 
riablcmenie cierto que los indi viduos mis j6ve- 
nes de estandarizacidn tienen mayor nivel de 
educacidn que los mayores; es muy probable 
que las bajas calificaciones de estos ultimos sean 
consecuencia, en parte, de estas diferencias 
educativas, mis que significar una disminucidn 
inexorable relacionada con la edad. 

ESTUDIOS SECUENC1ALES 
DE LA INTEUGENC1A 

Para controlar las diferencias entre grupos por 
edad, muchos investigadores prefiercn un dl- 
seno longitudinal, en el que se somete a prue- 
ba a los mismos individuos dos o mis veces en 
periodos de 5 a 10 aitos y, en casos excepcio- 
nales, hasta 40 afios despues. Debido a que s6lo 
se tiene un grupo de individuos, los disehos 
longitudinales climinan las disparidades de los 
grupos por edad (p. ej., mayor educacidn en 
los jdvenes que en las personas mayores) como 
un factor productor de confusidn. No obstante, 
este enfoque no deja de tcner sus defectos: 

1. El momento en que ocurre la medicidn cons- 
tituye el problema mis serio. Los aconteci- 
mienlos histdricos de gran importancia. 


como una depresidn econdmica, puedcn tor- 
cer el desarrollo intelectual y psicoldgico de 
generaciones completas. Como resultado, los 
cambios relacionados con la edad que se 
hayan medido de manera longitudinal puc- 
den reflejar las peculiaridades del momen¬ 
to de la medicidn, mis que cualesquiera 
efectos universales de la edad. 

2. Desgaste selectivo —los individuos mcnos 
capaces pueden estar en mayor probabili- 
dad de abandonar el estudio, lo cual infla de 
manera artificial las calificaciones de la 
prucba de los individuos que vuelven a exa- 
minarse. 

3. Efectos de la prictica —los individuos cxa- 
minados mejoran cuando realizan la misma 
prueba 2, 3 e incluso 5 veces. 

4. Regresidn a la media —esto constituyc un 
problema, en especial cuando se seleccio 

a los participantes debido a sus calificac 
nes iniciales extrcmas. como una calificac 
muy baja de Cl (Hayslip y Panek, 1989). 

El mdtodo mis eficaz para el estudio de los cam- 
bios en habilidad relacionados con la edad es 
cl diseno transecuencial, que combina las 
mctodologfas de los estudios transversal y 
longitudinal (Schaie, 1977): 
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£n pocas palabras, los Investlgadores comion- 
za n con un estudio transversal. Despuds, luego 
de un periodo de anos, vuelven a someter a prue¬ 
ba a eslos individuos, lo cual propordona datos 
longitudinales acerca de varias cohortes —una 
secuencla longiludinal. Al mismo Oempo, examl- 
nan a un nuevo grupo de personas, con lo cual 
se forma un segundo estudio transversal —y, jun¬ 
to con el primero, una secuencla transversal. El 
proceso complete puede realizarse una y olra vez 
(cada 5 o 10 aAos, por dedr) oon revaloradones 
de los vlejos partidpantes (lo cual aumenta los 
datos longitudinales) y pruebas Iniciales para 
los nuevos (que aumentan los datos transver- 
sales); (Schaie y Willis, 1986). 

En 1956, Schaie comenzd el mds amplio estu¬ 
dio trnnsecuencial jamas conducido en lo que 
se conoce como el Estudio longitudinal de 
Seattle (Schaie, 1958, 1983, 1994). Aplic6 la 
prueba de cinco Habilidades Mentales Prima- 
rias (PMA) de Thurstonc y otras mcdidas rela- 
cionadas con la inteligencia a una muestra 
transversal inicial de 500 habitantes adultos de 
la comunidad. Las subpruebas de la PMA in- 
cluyen Significados Verbalcs, Espacial, Razo- 
namiento, Numero y Fluidez de Palabras. En 
1963, volvid a someter a prueba a estos indivi¬ 
duos y afiadid una nueva cohorte transversal. 
Se recolectaron conjuntos adicionalcs de datos 
en 1970, 1977, 1984 y 1991. 

El estudio transccuencial de Schaie acerca 
de las habilidades mentales adultas produjo tres 
conclusiones: 

1. Cada estudio transversal indied cierto grado 
de disminucidn relacionada con la edad en 
habilidades mentales, comenzando despuds 
de los 35 afios para algunas capacidadcs, 
hasta despuds de los 50 para otras. En parti¬ 
cular, Ntimero y Fluidez Verbal muestran una 
disminucidn sdlo despuds de los 50 afios, 
parccen disminuir mds pronto, despuds de 
los 35 anos. 

2. Los estudios transversales sucesivos —la 
secuencia transversal— reveld diferencias 
intergeneracionales significativas en favor de 
los mds jdvenes. Incluso si se mantienc cons- 
tante la edad, aquellos nacidos y examinados 
recientemcntc tuvieron mejor desempefio 
que aqudllos nacidos y examinados antes. 


Por ejemplo, los individuos de 30 arias de 
edad evaluados en 1977 tendieron a obtener 
mejorcs califtcaciones que las personas de 
30 ados evaluadas en 1970, quicnes tendie¬ 
ron a presentar mejores califtcaciones que 
los individuos examinados en 1963, y dstos, 
a su vez, tuvieron mejor desempefio que 
aqudllos examinados en 1956. No obstante, 
estas diferencias de cohorte en cuanto a in¬ 
teligencia no fueron uniformes a travds de 
las diferentes habilidades mcdidas por la 
PMA. El patrdn de habilidades ascendentes 
fue mds aparente para Significados Verba- 
les, Razonamiento y Espacial. Los cambios 
de cohorte para Ntimero y Fluidez Verbal 
fueron mds complejos y contradictorios. 

3. En contraste con las conclusiones modera- 
damente pesimistas de las comparaciones 
transversales, las comparaciones longitudi¬ 
nales mostraron una tendencia, ya sea a que 
las califtcaciones promedio se eleven de 
manera imperceptible o que permanezean 
constantes hasta los 60 o 70 afios de edad. 
La unica excepcidn en csta tendencia impli¬ 
ed las pruebas que requieren altos nivcles 
de velocidad, como Fluidez de Palabras, en 
la cual los examinados deben nombrar pala¬ 
bras dentro de una categorfa dada con la 
mayor rapidez posible, y Numero, donde las 
personas deben llevar a cabo cdlculos arit- 
mdticos de manera rdpida y precisa. 

Los resultadas del estudio de Schaie son inclu- 
so mds optimistas cuando las conclusiones 
longitudinales se separan de los promedios de 
grupo. Como se sefiald antes, las conclusiones 
longitudinales difirieron de una habilidad men¬ 
tal a otra. Sin embargo, al tomar el promedio 
de las cinco habilidades mentales primarias y 
utilizar el percenti! 25 para los individuos de 
25 afios de edad como su norma de dcclinacidn 
significativa, Schaie ha mostrado que no mds 
de 25% de aquellas personas estudiadas ha de- 
clinado para la edad de 67 afios. De los 67 a los 
74 afios de edad, cerca de un tercio de las per¬ 
sonas ha mostrado disminucidn, mientras que 
de los 74 a los 81 afios apenas un poco mds de 
40% de las personas ha presentado declinacidn 
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(Schaie, 1980.1984,1994; Schaiey Willis. 1986). 
En resumen, la mayorfa de personas no mues- 
tra una disminucidn significativa cn las habili- 
dades medidas por la Prucba dc Habilidadcs 
Mentales primarias hasta quc sc encuentra bas- 
tante dentro de su sdptimo decenio de vida. 
Quizes incluso es mas impresionante el hecho 
dc quc alrcdedor de 10% de la muestra mejor6 de 
manera significativa cuando se le volvid a exa- 
minar en su sbptimo y octavo decenio de vida. 
Con base en su investigacidn y en olros estudios 
longitudinales, Schaie llega a csta conclusion: 

Si conserve su salud y parlidpa mentalmente en 
los problemas y actlvldades del mundo a su alre- 
dedor, es muy probable qua experimente poca o 
ninguna dismlnudbn en su desempefio Intelec- 
tual a lo largo de la vida. Esa es la promesa de la 
investigacibn en el brea de la inteligencia adulta 
(Schaie y Willis. 1986). 

Se coincide con esta resolucidn, pero no seri'a 
justo dejar la impresidn de que (odas las autori- 
dades en el drea concuerdan con clla. Horn y 
Cattell han sido los escdpticos quc mbs se han 


cxprcsado al nespecto, afirmando que existe una 
disminucidn significativa rclacionadacon la edad 
en cuanto a inteligencia fluida. dcbido a que 6sta 
depcndc dc la intcgridad neuronal que sc supo- 
ne prcsenta una declinaci6n a medida que sc 
avanza en edad (Horn y Cattell, 1966; Horn, 
1985). Los estudios transversales seguramcntc 
apoyan esta perspective. Por ejemplo, Wang y 
Kaufman (1993) graficaron las difercncias dc 
edad en las calificaciones de Vocnbulario y 
Matrices de la Kaufman Brief Intelligence Test 
(Prueba Breve de Inteligencia de Kaufman) y 
cncontraron poco cambio en vocabulario (me- 
dida cristalizada), pero una cafda pronunciada 
cn Matrices (medida fluida). Estos resultados 
se mantuvieron incluso cuando se ajustaron las 
calificaciones en cuanto a nivcl cducativo (fi. 
gura 7-12). Por supuesto, los estudios trans¬ 
versales estbn abiertos a otras interpretacio- 
nes y, por tanto, s6lo pueden sugerir patrones 
longitudinales. Los lectores que deseen seguir 
esta controversia deberfan consultar a Kausler 
(1991) y Lindenbergcr y Baltes (1994). 



Flgura 7-12. Punluaciooes estandar promedlo ajustadas en la KBIT en luncibn de la edad. 

Fuente: Reproducido con autorizacion de Wang. J. y Kaufman, A. (1993). Changes in fluid and crystallized intelligence 
across the 20- to 90- year age range on the K-BIT. Journal of Psychooducational Assessment, 11, 29-37. 
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g CAMBIOS GENERACIONALES 
g- EN LAS CALIFICACIONES DE 

IPRUEBAS DE INTELIGENCIA 

- 

•Qub succdc con la inteligencia dc una pobla- 
a 6n dc una generacibn a la siguicntc? Por ejem- 
p|o. ^cbmo se compara la inteligencia dc los 
otadounidcnscs en el decenio dc 1990 con la 
4e sus antcpasados a inicios del siglo XX? 
ppdrta esperarse que cualcsquiera difcrcneias 
foeran pequefias. Dcspuds de lodo, la rescrva 
gendtica ha pcrmanecido esencialmcntc cons¬ 
ole durante siglos, quizi milenios. Lo que es 
mis. sblo una pcqueiia fraccibn de cualquier 
generacibn estd expucsta a los extremos de en- 
tiquecimiento o privacibn ambiental que po- 
drfan reducir o elevar la inteligencia de manera 
(spectacular. Asf, el sentido comun dicta que 
todo cambio gcneracional en la inteligencia dc 
It poblacibn serfa mfnimo. 

Sobre este asunto, el sentido comun pare- 
ceestaren un error. Flynn (1984, 1987, 1994) 
conjuntb en un cuadro los datos de estanda- 
rizacibn dc ediciones sucesivas de la Stanford- 
Binet y de las pruebas Wechslcr desde 1932 
hasta 1981 y cncontrb que cada edicibn esta- 
blecib una norma mis elevada que su antcce- 
sora (cuadro 7-6). La ganancia total asciende a 
una elevacibn aparente dc 13.8 puntos en el Cl 
promedio. Asf, una persona que haya obtenido 
unCI Total de 100 puntos en 1990, habrfa ob- 
lenido en promedio jun Cl dc 114 en 1932! Se 
Itaobservado una elevacibn similar en el desem- 
penoen muchas otras naciones industrializadas 
utilizando pruebas como Matrices Progresivas 
de Raven (Flynn, 1987). 

En apariencia, los ciudadanos de los pafses 
occidentalcs induslrializados han logrado un 


mejor nivcl de educacibn y de alfabetizacibn en 
el siglo XX, lo cual ha producido que los nive- 
les del Cl promedio sc eleven mucho. No obs¬ 
tante, el aumento de Cl de esta magnitud plantea 
un grave problema de explicacibn causal. Flynn 
(1994) sc muestra escdplico de que cualquier 
inteligencia real y significativa dc una poblacibn 
pueda elevarsccon tal rapidez. Concluye que las 
pruebas actualcs no miden inteligencia, sino mbs 
bien un correlato con un vinculo causal ddbil 
dc dsta: 

... los psicdlogos deberfan dejar de decir que las 
pruebas de Cl miden inteligencia. Deberian decir 
que las pruebas de Cl miden capacidad para 
solucionar problemas abstractos (CSPA), un tdr- 
mino que transmile de manera precise nuestra 
Ignorancia. Sabemos que las personas resuel- 
ven problemas en las pruebas de Cl; sospecha- 
mos que dstos estan tan separados o alejados 
de la realldad, que la capacidad para resolverlos 
puede diferenciarse a travds del tiempo de la 
capacidad de solucidn de problemas reales 11a- 
mada Inteligencia; aparte de esto sabemos muy 
poco (Rynn, 1987). 

Aunque el prccepto radical de Flynn no ha reci- 
bido un apoyo general por parte de los expertos 
en el campo. este autor sf ha sensibilizado a los 
psicbmetras acerca de los peligros dc Ucgar a 
conclusiones con base en las normas siempre 
cambiantes de las pruebas de inteligencia. El 
aumento de los nivcles dc Cl a travds del tiem¬ 
po obliga a que las pruebas vuelvan a estan- 
darizarse con frecuencia; dc otro modo, se estb 
calificando a las personas evaluadas con nor¬ 
mas obsoletas y se les dan calificaciones dc Cl 
infladas (Flynn, 1994). Neisscr (1998) ha edi- 
tado un libro que estudia las posibles explica- 
ciones para la elevacibn dc la curva de 
puntuacioncs dc Cl. 


RESUMEN 

1. El sesgo de una prueba sc define como la 
validcz diferencial de una interpretacibn 
dada a una calificacion de prueba para cual- 
quicr subgrupo definible y rclacionado de 


personas evaluadas. Como ejemplo del ses¬ 
go de una prueba, una prueba verbal de 
aritmdtica presentada en ingibs podrfa fun- 
cionar bien para ninos de habla inglesa. 


■ 
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Cuadro 7-6. Comparacibn de Cl promedio de ediciones sucesivas de las pruebas 

Stanford-Binet y Wechsler 


Comblnaclones 
de prueba 


Fechas 


Edades 


Medias 

Ganancia 

Prueba 1 

Prueba 2 

Aftos 

Aftos 

N 

Prueba 1 

Prueba 2 

1. S8-L & WISC 

1932 

1947.5 

15.5 

5-15 

1 563 

107.13 

101.64 

5.49 

2. SB-M & WISC 

1932 

1947.5 

15.5 

5 

46 

125.13 

107.56 

17.57 

3. SB-LM & WISC 

1932 

1947.5 

15.5 

5-15 

460 

114.64 

109.67 

4.97 

4. SB-L & WAIS 

1932 

1953.5 

21.5 

16-32 

271 

113.02 

105.48 

7.54 

5. SB-LM & WAIS 

1932 

1953.5 

21.5 

16-48 

79 

109.08 

101.75 

7.33 

6. SB-LM & WPPSI 

1932 

1964.5 

32.5 

4-6 

416 

101.74 

92.78 

8.96 

7. SB-LM & SB-72 

1932 

1971.5 

39.5 

2-18 

2 351 

107.08 

97.19 

9.89 

8. WB-I & WISC 

1936.5 

1947.5 

11 

11-14 

110 

103.51 

105.54 

-2.03 

9. WB-I & WAIS 

1936.5 

1953.5 

17 

16-39 

152 

122.94 

118.25 

4.69 

10. WISC & WAIS 

1947.5 

1953.5 

6 

14-17 

436 

101.76 

99.12 

2.64 

11. WISC & WPPSI 

1947.5 

1964.5 

17 

5-6 

108 

93.56 

90.86 

2.70 

12. WISC & SB-72 

1947.5 

1971.5 

24 

6-10 

30 

96.40 

84.42 

11.98 

13. WISC & WISC-R 

1947.5 

1972 

24.5 

6-15 

1 042 

97.19 

88.78 

8.41 

14. WAIS & WISC-R 

1953.5 

1972 

18.5 

16-17 

40 

102.94 

96.29 

6.65 

15. WAIS & WAIS-R 

1953.5 

1978 

24.5 

35-44 

72 

109.69 

101.65 

8.04 

16. WPPSI & SB-72 

1964.5 

1971.5 

7 

4-5 

35 

93.06 

88.65 

4.41 

17. WPPSI & WISC-R 

1964.5 

1972 

7.5 

5-6 

140 

112.84 

108.58 

4.26 

18. WISC-R & WAIS-R 

1972 

1978 

6 

16 

80 

99.61 

98.65 

096 

19. WISC-R & WISC-III 

1972 

1988 

16 

6-16 

206 

108.20 

102.90 

5.30 

20. WAIS-R & WISC-III 

1978 

1988 

10 

16 

189 

105.30 

101.40 

3.90 

21. WPPSI-R& WISC-III 

1986 

1988 

2 

6 

188 

106.50 

102.50 

4.00 

22. WISC-III & WAIS-III 

1988 

1996 

8 

16 

184 

104.60 

103.90 

.70 


Nota: Foehns se reliere a las lechas de estandarizacidn do las pruebas de comparactdn, Aftos se reliere a los aftos etiire 
estandarizaclones; Edades se reliere al rango de edad de los parlicipanles somelidos a prueba, Ganancia se reliere a la ganada 
aparonte en Cl. 

Fuenlo: Adaptado con autorizacidn de Flynn. J. R (1984) The mean IQ ot Americans: Massive Gains 1932 lo 1978 Psychdogictl 
Butiotm, 95. 29-51 


mientras que para aqudllos de habla hispa- 
na, la misma podrfa predecir de manera de- 
ficiente sus habilidadcs aritmbticas. 

2. El sesgo en la validez de contenido se de- 
muestra cuando un reactivo o subescala de 
una prueba es relativamentc mds diffcil para 
los miembros de un grupo que para los de 
otro, despuds de que se ha mantenido cons- 


tante el nivel de capacidad general. En 
tdrminos generates, para las principales 
pruebas estandarizadas de capacidad y ap- 
titud, la evidencia de sesgo de contenido es 
escasa o nula. 

3. El sesgo en la validez predictiva o relacio- 
nada con el crilerio se demuestra cuando 
una prueba no predice igualmentc bien un 
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criterio relacionado cn personas de diferen- 
tes subpoblaciones. Una prueba imparcial 
posee regression homogdnca: los resultados 
de todas las subpoblaciones relacionadas se 
agrupan por igual alrededor de una sola If- 
nea de regresidn. 

4 . El sesgo cn la validez de constructo se de- 
muestra cuando una prueba mide rasgos o 
constructos diferentes en un grupo que en 
oCro. Comparando subpoblaciones rclacio- 
nadas, una prueba imparcial revelarfa un 
alto grado de semejanza en cuanto a la es- 
tructura factorial de la prueba y la clasifi- 
cacidn de los reactivos de acuerdo con el 
nivel de dificultad dentro de la prueba. 

5. La justicia de prueba incorpora valores y 
filosoffas sociales acerca del enipleo de 6s- 
tas. Se han descrito tres filosoffas: indivi- 
dualismo no cualificado (selcccionar a la 
mejor persona utilizando todos los medios 
de prediccidn), cuotas (seleccidn de acuer¬ 
do con proporciones) e indi vidualismo cua¬ 
lificado (scleccionar a la persona sin tomar 
en cuenta raza, sexo, etc., como medios de 
prediccidn). ;CudI de las tres filosoffas es 
la correcta? Esta es una cuestitin titica que 
estti mis alia de una solucitin objetiva. 

6. Por lo general, la contribucidn gendtica a 
las caracterfsticas humanas se mide en tdr- 
minos de un fndice de hcreditabilidad que 
puede variar de 0 a 1.0. La hcreditabilidad 
es un estimado de la cantidad de varianza 
total de un rasgo dado que se debe a factorcs 
gendticos. £sta es relativa a la poblacitin 
muestreada y no explica las calificaciones 
individuates. Para el Cl, la mayor parte de 
los estimados de hcreditabilidad se encuen- 
tran alrededor de .50. 

7. La evidencia de una contribucitin gendtica 
a la intcligencia se ha documentado a tra- 
vds de los Estudios Minnesota sobre geme- 
los, en los que se retine a gemelos iddnticos 
separados al nacer y se les aplica un exa¬ 
men psicoldgico extenso. Aunque muchos 
pares de gemelos se criaron en ambientes 
disfmbolos, sus Cl adultos son notablemente 
similares. Estos datos corroboran estudios 
anteriores sobre adopcitin. 


8. Jensen (1977) estudid los cfcctos acumu- 
lativos de un ambiente sombrfo, dc pri vacidn, 
sobre los Cl de ninos afroestadounidenses 
de entomos rurales. Encontrd que quienes 
eran mayores tenfan calificaciones mtis ba- 
jas que sus hermanos menorcs, perdiendo 
aparentemente cerca de un punto de Cl por 
ano. en promedio, entre los de 6 y 16 aflos 
de edad. 

9. Scarr y Weinberg estudiaron los efectos del 
enriquecimicnto ambiental: encontraron que 
los ninos afroestadounidenses adoptados por 
familias de raza blanca de clase media alta 
mostraban un Cl superior al promedio. 

10. El alcoholismo crdnico en mujeres embara- 
zadas causa alto riesgo en sus hijos de pre- 
sentar sfndrome alcoholico fetal, que sc 
caracteriza por anormalidadcs faciales, de- 
ficiencias en el crecimiento, problemas 
motores, hiperactividad y retraso mental de 
leve a moderado. Con menores niveles 
de ingestitin de alcohol, los hijos pueden 
mostrar alteracioncs en atcncidn y otros pro- 
blcmas sutiles conocidos como efecto al- 
cohdlico fetal. 

11. Las toxinas ambientales tambidn pueden 
afectar a la inteligencia. Por ejemplo, los 
ninos que absorben cantidades indebidas de 
plomo (p. ej., por ingerir pcquefios trozos 
de pintura con pigmentos de plomo) pueden 
presentar disminuciones a largo plazo en el 
funcionamiento mental (rcduccidn del Cl, 
problemas con el procesamiento auditivo y 
del habla y lentificacitin en el tiempo de 
reaccitin). 

12. En promedio, los individuos afrocstado- 
unidenses obtienen 15 puntos menos que 
los estadounidenses de raza blanca cn prue- 
bas estandarizadas de Cl. Cuando se toman 
cn cuenta las variables demogrtificas como 
la clase social, la diferencia se reduce de 7 
a 10 puntos. En apariencia, la magnitud de 
la diferencia ha pcrmanecido constante des- 
dc mediados hasta finales del siglo XK. 

13. Jensen (1969) y otros autores han propuesto 
que los individuos de raza blanca obtienen 
mayores calificaciones que los afroesta¬ 
dounidenses en pruebas de Cl debido, en 
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parte, a factores gendticos. Esta hipdtcsis 
se basa cn la cuestionable suposicidn dc que 
la evidencia de la hereditabilidad del Cl 
dentro dc grupos puede utilizarsc para 
infcrirla enlre grupos raciales. La investi- 
gacidn sobre mezcla racial y Cl no apoya 
una pcrspectiva gendlica. 

14. La investigacidn longitudinal sobre edad e 
intcligencia proporciona una pcrspectiva 
mds optimista quc la investigacidn transver¬ 
sal. En los cstudios longitudinales, la ma¬ 
yor parte dc las capacidades cambian poco 
hasta que se llega, cuando mcnos, a los 
60 aflos dc edad. Las capacidades fluidas 


—principalmentc laeficicncia mental no ver¬ 
bal y con influencia reducida de la cultu- 
ra— muestra mayor disminucidn con la 
edad quc otras capacidades. 

15. Flynn conjuntd los datos de estandarizacidn 
de cada edicidn de la Stanford-Binct y de 
las Escalas Wechslcr desdc 1932 hasta la 
actualidad. Cada prueba estableci6 un 
estandar mds alto que su antecesora. con 
una ganancia total de cerca de 14 puntos 
de Cl, lo que plantea graves problemas dc 
explicacidn e indica que las normas para 
las pruebas pueden cambiar con gran ra- 
pidez. 
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En cste capftulo sc analiza una variedad 
de instrumentos que tradicionalmcnte se agru- 
pan bajo los encabezados de pruebas de apti¬ 
tud y de rendimiento; incluye instrumentos para 
estc propdsito, pero tambidn engloba los temas 
y aplicaciones cn las pruebas de aptitud y ren- 
dimicnto. En el tema 8A, Pruebas de aptitud 
y andlisis factorial, se describe el empleo del 
iniluis factorial cn cl dcsarrollo de las medidas 
de aptitud; tambidn se revisan los instrumentos 


tfpicos, incluyendo las baterfas de prueba de 
aptitudes multiples y aquellas que se utilizan para 
predecirel desempeno acaddmico en la univer¬ 
sidad. En cl tema 8B, Pruebas grupales de ren¬ 
dimiento, se analizan las baterfas de prueba de 
rendimiento educativo familiares para todo 
alumno del sistema cscolar en EUA. Ademds, cl 
lector encontrard un breve andlisis de las prue¬ 
bas con propdsitos especiales para rendimien¬ 
to, asf como una revisidn de las cuestiones 
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sociales perturbadoras que se refiercn al fal- 
seamiento de resultados dentro del sistema es- 
colar cn las prucbas de rendimicnto. 

Aquf la informacidn se centra en las pruc¬ 
bas de aptitud, especialmcntc las baterfas de 
aptitudes multiples que se emplean por lo co- 
mun para predecir el dcsempcno futuro cn la 
escucla, cmpleo y entomos militares. Es comun 
que cstas baterfas tengan la funcidn de servir 
como guardianes, pues las tres situaciones an- 
teriores pueden depender de las conclusioncs 
derivadas de las pruebas que se revisan aquf. 
Las pruebas de aptitud imponen gran respeto 
y, por tanto, ejercen una inmensa influencia so- 
bre la sociedad modema; de hecho, su validcz 
es trasccndental. El lector aprenderii rods sobre 
la aplicacidn de estas pruebas en estc tema. 

Muchas pruebas de aptitud surgieron como 
derivacioncs cspecializadas de las pruebas de 
capacidad poco despuds de que los psicdlogos 
desarrollaron las herramientas cstadfsticas nc- 
ccsarias para dividir la inteligencia general en 
sus subcomponcntes. Dicho en tdrminos senci- 
llos, la mayor parte de las pruebas de aptitud 
deben su origen al andlisis factorial, una fami- 
lia de proccdimientos que los invcstigadorcs 
utiliza para resumir las relaciones entre varia¬ 
bles que se correlacionan de manera sumamentc 
compleja. Debido a que las pruebas de aptitud 
no pueden florecer sin el andlisis factorial, sc 
comenzard esta seccidn con un compendio de 
esta util tdcnica estadfstica. Despuds, el tema 
continua con un andlisis de las pruebas mds 
importantes de aptitud, que incluyen las bate¬ 
rfas de aptitudes multiples (Test de aptitudes 
diferencialcs, General Aptitud Test Battery [Ba- 
terfa de pruebas de aptitud general] y Armed 
Services Vocational Assessment Battery (Batc- 
rfa de evaluacidn vocational de las fuerzas ar¬ 
madas]), pruebas que sc utilizan para admisidn 
a la universidad (Scholastic Assessment Tests 
[Prueba de evaluacidn escolar], American 
College Test [Prueba universitaria cstadouni- 
dense]) y pruebas de admisidn al posgrado 
(Graduate Record Exam [Examen de seleccidn 
para posgrado], Medical College Admission 
Test [Prueba de admisidn a la facultad de medi- 
cina] y Law School Admission Test [Prueba de 
admisidn a la escuela de leyes]). 


8 COMPENDIO SOBRE ANAUSIS 
FACTORIAL _ 


En terminos atnplios, existen dos formas de 
andlisis factorial: confirmatorio y exploratorio, 
En el primero, cl propdsito consiste en confir- 
mar que las calificaciones de una prueba y las 
variables encajan en cierto patron predicho por 
una teorfa. Por ejemplo, si la teorfa subyaccnte 
a cicrta prueba de inteligencia indica que las 
subpruebas pertcnccen a ires factorcs (p. ej,, 
factores verbal, de ejecucidn y de atencidn), 
entonces se emprenderfa un andlisis factorial 
confirmatorio para evaluar la prccisidn de tal 
prediccidn. El andlisis factorial confirmatorio 
es esencial para la validacidn de muchas pruc¬ 
bas de capacidad. 

El propdsito central del aualisis factorial 
exploratorio es resumir las intcrrclaciones en¬ 
tre gran cantidad de variables de una manera 
concisa y precisa como auxiliar para la con- 
ceptuacidn (Gorsuch, 1983). Por ejemplo, cl 
andlisis factorial puede ayudar a un investiga- 
dor a descubrir que una baterfa de 20 pruebas 
represents sdlo cuatro variables subyaccntes, 
llamadas factores. Puede utilizarse el menor 
conjunto de factores derivados para represen- 
tar los constructos csenciales que subyacen al 
grupo completo de variables. 

Quizds una analogfa simple ayude a acla- 
rar la naturaleza de los factores y su relacidn 
con las variables o pruebas de las cuaics se de- 
ri van. Considdrese el decatldn de pista y cam- 
po, una mezclade 10 competences diversas que 
incluyen carreras de corta distant ia, cameras con 
obstaculos, salto con gamocha, lanzamiento de 
bala y carreras de larga distancia, entre otras. 
Para conceptuar la capacidad del decatleta in¬ 
dividual, no se piensa de manera cxclusiva cn 
tdrminos de las habilidades del participate para 
certdmenes especfficos. En vez de ello, se pien¬ 
sa en tdrminos de atributos tnds bdsicos, como 
vclocidad, fortaleza, coordinacidn y rcsistencia. 
cada uno de los cuales se refleja en grado dife- 
rente en las competencias individuales. Por 
ejemplo, el salto con garrocha requiere veloci- 
dad y coordinacidn, mientras las competencia* 


I 
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dc carreras de obslftculos demandan coordina¬ 
te y resistcncia. Estos atributos inferidos son 
a niilogos a los factorcs subyacentes al an&lisis 
factorial. De la misma manera que los resulta- 
dos dc 10 compctencias de un decatlbn puedcn 
(educirsc a un pequcfio numcro dc factorcs sub¬ 
yacentes (p. ej., vclocidad, fortalcza, coordina¬ 
te y resistcncia). los resultados dc una baterfa 
de 10 o 20 prucbas puedcn rcflcjar la operation de 
un pequcfio numero dc atributos cognitivos 
bdsicos (p. ej., habilidad verbal, visualizacibn, 
cilculo y atencibn, por citar una lista hipotbti- 
ca). Estc ejcmplo ilustra cl objctivo del andlisis 
factorial: ayudar a producir una descripcibn 
cconbmica de conjuntos amplios y complejos 
de datos. 

Sc ilustrardn los conccptos cscnciales del 
andlisis. factorial con un cjemplo tfpico rclacio- 
nado con el numero y tipo de factores que pue¬ 
dcn describir mejor las capacidades de un 
estudiante. Holzinger y Swincford (1939) apli- 
caron 24 pruebas psicolbgicas relacionadas con 
capacidad a 14S estudiantcs de secundaria dc 
Forest Park Illinois. El anblisis factorial que se 
describe enseguida se bas6 cn los mbtodos dcs- 
critos en Kinnear y Gray (1997). 

Para el lector deberfa ser obvio a nivel in- 
tuitivo que cualquicr baterfa extensa de prue¬ 
bas de capacidad reflejard un numcro menor 
de capacidades bdsicas subyacentes (factorcs). 
Considdrcnsc las 24 pruebas representadas en 


el cuadro 8-1; seguramente algunas reflcjan 
capacidades subyacentes comunes. Por ejemplo, 
se esperarfa que Oraciones incompletas, Clasi- 
ficacion de palabras y Significados de palabras 
(variables 7, 8 y 9) midan un factor de capaci¬ 
dad general de lenguaje de algun tipo. De la 
misma manera, parece probable que otros gru- 
pos de pruebas midan capacidades subyacentes 
comunes. Pero ^cudntas capacidades o factorcs?, 
y £cudl es la naturaleza de estas capacidades 
subyacentes? El andlisis factorial es la herra- 
mienta ideal para responder a estas preguntas. 
En este caso sc sigue el anblisis factorial de los 
datos de Holzinger y Swincford (1939) de prin- 
cipio a fin. 

MATRIZ DE CORRELA06n 

El punto inicial de todo anblisis factorial es la 
matriz de corrclacidn, una tabla complcta de 
intcrconelacioncs entre todas las variables.* Las 
corrclacioncs entre las 24 variables dc capaci- 


* En cstc ejcmplo, las variables son pruebas que produ- 
ccn calificacioncs mSs o rocnos continuas. Pcro las 
variables cn un anilisis factorial puedcn asumir otras 
formas, en lanlo se puedan expresar como califica- 
ciones continuas. Por cjemplo, las siguicnlcs puedcn 
ser variables cn un an&lisis factorial: estatura, peso, 
mgresos, clase social y resultados en una eseala de 
calificacidn. 


Cuadro 8-1. Las 24 pruebas de capacidad empleadas 
por Holzinger and Swineford (1939) 


1. Percepcidn visual 

2. Cubos 

3. Tablero con formas do papel 

4. Banderas 

5. Inlormacion general 

6. Comprension de pArrafos 

7. Frases incompletas 

8. Clasificacidn de palabras 

9. Significado de palabras 

10. Sumas de dfgitos 

11. Claves (velocidad perceptual) 

12. Conleo de grupos de puntos 


13. Mayuscutas rectas y curvadas 

14. Reconocimiento de palabras 

15. Reconocimiento de numeros 

16. Reconocimiento de (iguras 

17. Objeto-numero 

18. Ntimero-figura 

19. Figura-palabra 

20. Deduccibn 

21. Acertijos numbricos 

22. Razonamiento de problemas 

23. Completamiento de series 

24. Problemas aritmbticos 
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dad que se analizan aquf pueden enconuarse en 
cl cuadro 8-2. El lector observard que las va¬ 
riables 7, 8 y 9 sf se intcrcorrelacionan, de hc- 
cho, de mancra bastantc fuerte (correlaciones 
de .62, .69 y .53), como se sospechaba antes. 
Este patrdn de intercorrclaciones cs presunta 
evidencia de que estas variables miden algo cn 
comun; es decir, parece ser que estas pruebas 
reflejan un factor subyacente comun. No obs¬ 
tante, este tipo de antilisis factorial intuitivo 
basado en una inspeccidn visual de la matriz 
de correlacidn es muy limitado; simplemente 
hay demasiadas intercorrelaciones como para 
que la persona que examina la matriz pueda dis- 


cemir de manera visual los patrones subyacen- 
tes para todas las variables. Aquf es donde puc. 
de ser ritil cl anAlisis factorial. Aunquc no se 
puede especificar la mec&nica del procedimien- 
to, el aniilisis factorial depende de computado- 
ras de alta velocidad para buscar la matriz de 
corre!aci6n segun rcglas cstadfsticas objetivas 
y determinar el mcnor numcro de factorcs nece- 
sarios para explicar el patrdn de intercorTe- 
laciones observado. El aniilisis tambidn produce 
la matriz factorial, una tabla que muestra el gra- 
do en el cual cada prueba tiene cargas en (o se 
correlaciona con) cada uno de los factores dc- 
rivados, como se analiza a continuacidn. 


Cuadro 8-2. Matriz de correlacidn para 24 variables de capacidad 



1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

21 2223 

2 

32 





















3 

40 

32 




















4 

47 

23 

31 



















5 

32 

29 

25 

23 


















6 

34 

23 

27 

33 

62 

















7 

30 

16 

22 

34 

66 

72 
















8 

33 

17 

38 

39 

58 

53 

62 















9 

33 

20 

18 

33 

72 

71 

69 

53 














10 

12 

06 

08 

10 

31 

20 

25 

29 

17 













11 

31 

15 

09 

11 

34 

35 

23 

30 

28 

48 












12 

31 

15 

14 

16 

22 

10 

18 

27 

11 

59 

43 











13 

49 

24 

32 

33 

34 

31 

35 

40 

28 

41 

54 

51 










14 

13 

10 

18 

07 

28 

29 

24 

25 

26 

17 

35 

13 

20 









15 

24 

13 

07 

13 

23 

25 

17 

18 

25 

15 

24 

17 

14 

37 








16 

41 

27 

26 

32 

19 

29 

18 

30 

24 

12 

31 

12 

28 

41 

33 







17 

18 

01 

18 

19 

21 

27 

23 

26 

27 

29 

36 

28 

19 

34 

35 

32 






18 

37 

26 

21 

25 

26 

17 

16 

25 

21 

32 

35 

35 

32 

21 

33 

34 

45 





19 

27 

11 

31 

14 

19 

25 

23 

27 

27 

19 

29 

11 

26 

21 

19 

26 

32 

36 




20 

37 

29 

30 

34 

40 

44 

45 

43 

45 

17 

20 

25 

24 

30 

27 

39 

26 

30 

17 



21 

37 

31 

17 

35 

32 

26 

31 

36 

27 

41 

40 

36 

43 

18 

23 

35 

17 

36 

33 

41 


22 

41 

23 

25 

38 

44 

39 

40 

36 

48 

16 

30 

19 

28 

24 

25 

28 

27 

32 

34 

46 

37 

23 

47 

35 

38 

34 

44 

43 

41 

50 

50 

26 

25 

35 

38 

24 

26 

36 

29 

27 

30 

51 

45 50 

24 

28 

21 

20 

25 

42 

43 

44 

39 

42 

53 

41 

41 

36 

30 

17 

26 

33 

41 

37 

37 

45 3843 


Nota: Se omiten los decimates 

Fuente: Reproduddocon aulortzacidndeHotelngef l K.,& Harman,H (1941). Factor analysis: A synthesis ot factorial methods CNcagOC 
University oi Chicago Pross 
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HAATRIZ factorial y cargas 

fACTORIALES 

La matriz factorial consiste en una tabla dc 
correlaciones llamadas cargas factoriales. Es- 
tas ultimas quc puedcn asumir valores desde 
_1.00 hasta +1.00) indican la importancia dc 
cada variable en cada factor. Por ejcmplo, la 
matriz factorial en el cuadro 8-3 muestra que 
del aniilisis sc obtuvicron cinco factores (11a- 
mados I, II, III, IV y V). Vbase quc la primera 
variable, completamicnto dc scries, tienc una 
fuertc carga positiva de .71 en cl factor I, lo 
cual indica que esta prueba es un fndice razo- 
nablementc bucno dc esc factor. Obsbrvese tam- 
bidn que esta misma variable tienc una modesta 


carga negativa de -.11 en el factor II, lo cual 
indica que, en grado limitado, mide lo opuesto a 
este factor, es decir, las alias calificaciones en 
Completamicnto dc series tienden a significar 
bajas calificaciones en el factor II y viceversa. 

Los factores pueden parecer bastante mis- 
teriosos, pero en realidad son muy sencillos a 
nivet conceptual. Un factor no es nada mds que 
una suma lineal ponderada de las variables; es 
decir, cada uno es una combinacibn estadfstica 
precisa de las pruebas utiiizadas en el andlisis. 
En cierto sentido, un factor es el producto de la 
“suma” de partes cuidadosamente determi- 
nadas de algunas pruebas y quizd de la “resta” 
de fracciones de otras; lo que hace que sean 
especialcs es el elegante mbtodo analftico utili- 


Cuadro 8-3. Matriz factorial de ejes princlpales para 24 variables de capacidad 


Factores 



1 

1 

III 

IV 

V 

23. Completamiento de series 

.71 

-.11 

.14 

.11 

.07 

8. Claslficaclbn de palabras 

.70 

-.24 

-.15 

-.11 

-.13 

5. Informacibn general 

.70 

-.32 

-.34 

-.04 

.08 

9. Significado de palabras 

.69 

-.45 

-.29 

.08 

.00 

6. Comprension de pbrrafos 

.69 

-.42 

-.26 

.08 

-.01 

7. Frases incompletas 

.68 

-.42 

-.36 

-.05 

-.05 

24. Problemas aritmbticos 

.67 

.20 

-.23 

-.04 

-.11 

20. Deduccibn 

.64 

-.19 

.13 

.06 

.28 

22. Razonamiento de problemas 

.64 

-.15 

.11 

.05 

-.04 

21. Acertijos numericos 

.62 

.24 

.10 

-.21 

.16 

13. Mayusculas rectas y curvadas 

.62 

.28 

.02 

-.36 

-.07 

1. Percepcibn visual 

.62 

-.01 

.42 

-.21 

-.01 

11. Claves (velocidad perceptual) 

.57 

.44 

-.20 

.04 

.01 

18. Numero-figura 

.55 

.39 

.20 

.15 

-.11 

16. Reconocimiento de figuras 

.53 

.08 

.40 

.31 

.19 

4. Banderas 

.51 

-.18 

.32 

-.23 

-.02 

17. Objeto-numero 

.49 

.27 

-.03 

.47 

-.24 

2. Cubos 

.40 

-.08 

.39 

-.23 

.34 

12. Conteo de grupos de puntos 

.48 

.55 

-.14 

-.33 

.11 

10. Sumas de dlgitos 

.47 

.55 

-.45 

-.19 

.07 

3. Tablero de formas de papel 

.44 

-.19 

.48 

-.12 

-.36 

'4 Reconocimiento de palabras 

.45 

.09 

-.03 

.55 

.16 

f5. Reconocimiento de numeros 

.42 

.14 

.10 

.52 

.31 

'9 Figura-palabra 

.47 

.14 

.13 

.20 

-.61 







326 • Evaluation pslcologlca: Hlstoria, prindpios y apllcationes 


(Capflulo 8) 


zado para obtenerlos. Existen varios mdtodos 
quc dificrcn dc maneras sutilcs, diferencias quc 
salen del propdsito de este libro; el lector pue- 
de darse una idea de las diferencias al exami¬ 
ner los nombres de los procedi mientos: factores 
de componentcs principales, factores de ejes 
principales, mdtodo dc mfnimos cuadrados no 
ponderados, mdtodo de probabilidad maxima, 
factorization de imagen y factorizacidn alfa 
(Tabachnick y Fidcll, 1989). La mayor parte de 
los mdtodos producen resultados muy similares. 

Las cargas factoriales representadas en el 
cuadro 8-3 no son mds que coeficientes de co- 
rrclaciOn entre variables y factores. Estas corrcla- 
ciones pueden interpretarse como muestra de 
la importancia o carga dc cada factor en cada 
variable. Por ejemplo, la variable 9, la prueba 
dc Significado dc palabras, tienc una carga muy 
fuerte (.69) en cl factor I, tienc cargas negati- 
vas bajas (-.45 y -.29) en los factores II y III, y 
una carga insignificante (.08 y .001) en los fac¬ 
tores IV y V. 

REPRESENTACION GEOMETRICA 
DE LAS CARGAS FACTORIALES 

Sc acostumbra representar los primeros 2 o 3 
factores como ejes de referenda en un cspacio 
bidimensional o tridimensional.* Dentro de este 
esquema pueden representarse las cargas 
factoriales de cada variable con propdsitos dc 
cxaminaciOn. En el ejemplo se descubrieron 
cinco factores, demasiados para una visualiza¬ 
tion simple. No obstante, sc puedc ilustrar el 
valor de la representaciOn geomdtrica al sobre- 
simpliftcar los datos y representar sOlo los pri¬ 
meros dos factores (ftgura 8-1). En esta grdfica 
se ha representado cada una de las 24 pruebas 
contra los dos factores que correspondcn a 
los ejes I y II. El lector observard que las car¬ 
gas factoriales en el primer factor (I) son uni- 
formemente positivas, mientras las cargas 


• Tdcnicamente es posible representar todos los factores 
como ejes de referenda en un espacio de n dimensio¬ 
ned, donde n es el mimero dc factores. No obstante, 
cuando sc trabaja con mfis de 2 o 3 ejes de referenda, 
ya no es posible hacer una representaciOn visual. 


factoriales en cl segundo factor (II) constan de 
una mezcla de cargas positivas y negativas. 

MATRIZ FACTORIAL ROTADA 

Un punto importantc en este contexto es que la 
posicidn de los ejes de referenda es arbitraria, 
No existe nada que impida que el investigador 
gire los ejes, de modo que produzcan una me- 
jor correspondence con las cargas factoriales. 
Por ejemplo, el lector verd en la ftgura 8-1 que 
las pruebas 5, 6, 7 y 9 (todas pruebas dc len- 
guaje) se agrupan juntas. Con seguridad se 
aclararfa la interpretacidn del factor 1 si se les 
rcdirigicra cerca del ccntro de este agrupa- 
miento (ftgura 8-2). Esta manipulacidn tambidn 
llevarfa al factor II junto a las pruebas interpre¬ 
tables 10, 11 y 12 (todas pruebas numdricas). 

Aunque la rolacidn puede conducive de 
manera manual a travds de una inspcccidn vi¬ 
sual, es mds comun que los investigadores de- 
pendan de uno o mds criterios estadfsticos para 
producir la matriz factorial rotada final. Por lo 
comun, sc aplican los criterios dc Thurstone 
(1947) dc variedad positiva y cstructura sim¬ 
ple. En una rotacidn hacia variedad positiva, 
el programa de c6mputo busca eliminar la 
mayor cantidad posible de cargas factoriales ne¬ 
gativas. £stas tienen poco sentido en la evalua- 
ci6n dc la capacidad, dado que implican que 
las alias califtcaciones en un factor se correla- 
cionan con un bajo desempeho en prueba. En 
una rotneidn hacia estructura simple, el pro¬ 
grama de edmputo busca simplificar las cargas 
factoriales, dc modo quc cada prueba tenga car¬ 
gas significativas en el menor numero de fac¬ 
tores posible. La meta de ambos criterios cs 
producir una matriz factorial rotada tan senci- 
Ila y sin ambigOcdadcs como sea posible. 

En el cuadro 8-4 se muestra la matriz fac¬ 
torial rotada para este problems. El mdtodo 
particular de rotacidn que se utiliza aqut se de- 
nomina rotacidn varimax; no debc u till/.arse si 
la expectativa ledrica sugiere que puede haber 
un factor general. ^Se deberfa esperar un factor 
general en cl andlisis de las pruebas de capaci¬ 
dad? La respuesta es que esto es en mucho una 
cucstidn de fe al igual que de cicncia. Un investi- 
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Flgura 8-1. RepresenlackSn geomdtrica de los primeros dos (adores de 24 pruebas de capacidad. 


gador puede concluir que es probable la cxisten- 
cia de un solo factor y, por tanto. seguir un tipo 
difcrentc de rotacidn. Un segundo investigador 
puede sentirse edmodo con una perspectiva 
similar a la de Thurstone y buscar factores mul¬ 
tiples de capacidad utilizando una rotacidn va- 
rimax. Dcspuds se estudiard esta cuestidn en 
detalle, pero es necesario sefialar que un in¬ 
vestigador se enfrenta a muchos momentos de 
decisidn al realizar un andlisis factorial. No es 
de sorprender, entonces. que diferentes inves- 
tigadores puedan llcgar a diversas conclusio- 
nesa partii del andlisis factorial, inclusocuando 
analizan el mismo conjunto de datos. 

INTERPRETACl6N DE FACTORES 

El cuadro 8-4 indica que cuatro factores subya- 
cen a las intercorrclacioncs de las 24 pruebas 
de capacidad; pero, ^edmo se Ic llamard a estos 


factores? El lector puede encontrar inquietantc 
la respuesta a esta pregunta, dado que en este 
punto se dejan de lado los datos estadfsticos 
frfos y objeti vos para entrar en el drea del crite- 
rio, el discemimiento y las suposiciones. A fin 
de interpretar o nombrar a un factor, el investi¬ 
gador debe realizar un juicio razonado acerca 
de los procesos y capacidadcs comunes que 
comparten las pruebas con fuertes cargas en esc 
factor. Por ejemplo, en el cuadro 8-4 se mues- 
tra que el factor 1 ticne que ver con la capaci¬ 
dad verbal, dado que las variables con alias 
cargas destacan la habilidad verbal (p. ej., Fra- 
ses incompletas tiene una carga de .86, Signifi- 
cado de palabras tiene una carga de .84 y 
Significados de pdrrafos tiene una carga de .81). 
Las variables con cargas bajas lambidn ayudan 
a afinar el significado del factor 1. Por ejemplo, 
el factor I no se relaciona con habilidad numd- 
rica (Acertijos numdricos tiene una carga de. 18) 
o habilidad espacial (Tablero con formas de 
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Figure 8-2. Represenlacion geometries de los pnmeros dos laclores rotados de las 24 pruebas de capacidad 


papel tiene una carga de .16). Si se utiliza una 
forma similar de infercncia, parece ser que el 
factor II sc relaciona con la capacidad numdri- 
ca (Sumas tiene una carga de .85, Conteo de 
grupos de puntos tiene una carga de .89). El 
factor III cs menos seguro, pero parece relacio- 
narse con capacidad visual y el factor IV pare¬ 
ce ser una medida del reconocimicnto. Se 
necesitarfa analizar la unica prueba en el factor 
V (Figura-Palabra) para conjeturar el signifi- 
cado de este factor. 

Estos resultados ilustran uno de los prin- 
cipales usos del andlisis factorial, es decir, la 
identificacidn de un pcqucfio numero de prue¬ 
bas indicadoras de una baterfa grande de pruebas. 
En vez de utilizar una baterfa engorrosa de 24 
pruebas, un investigador podrfa obtener casi la 
misma inforrnacion al seleccionar con cuidado 
varias pruebas con fuertes cargas factoriales en 
los cinco factores. Por ejcmplo, el primer fac¬ 
tor est4 bien rcpresentado en la prueba 7: Frascs 


incompletas (.86) y la prueba 9: Significados 
de palabras (.84); el segundo se reflejaen la prue¬ 
ba 10: Sumas (.85), mientras el tercero se ilus- 
tra mejor a travds de la prueba 1: Pcrcepcidn 
visual (.69). El cuarto factor cs rcpresentado 
por la prueba 15, Reconocimienlo de Numcros 
(.74) y Reconocimienlo de Palabras (.69). Por 
supuesto, el ultimo factor s6lo tiene cargas ade- 
cuadas en la prueba 19, Figura-Palabra (.77). 

TEMAS SOBRE EL ANAUS1S FACTORIAL 

Por desgracia, es frecucntc que el an41isis fac¬ 
torial sc preste a malos entendidos y a menudo 
se le utiliza de manera inadecuada. Algunos 
investigadores parecen emplcarlo como una 
especie de varita mdgica, con la esperanza de 
cncontrar el oro oculto bajo toneladas de lodo. 
Pero la tdcnica no tiene nada de m4gico. Ningu- 
na cantidad de an&lisis estadfstico puede rescatar 
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Cuadro 8-4. Matrlz factorial con rotacidn varlmax para 24 variables de capacidad 


Factores 



1 

II 

III 

IV 

V 

7 Prases incompletas 

.86 

.15 

.13 

.03 

.07 

9 Slgnilicado de palabras 

.84 

.06 

.15 

.18 

.08 

6, Comprensibn de pbrrafos 

.81 

.07 

.16 

.18 

.to 

5 . informacibn general 

.79 

.22 

.16 

.12 

-.02 

8. Clasificadbn de palabras 

.65 

.22 

.28 

.03 

.21 

22. Razonamiento de problemas 

.43 

.12 

.38 

.23 

.22 

10. Sumas de dfgltos 

.18 

.85 

-.10 

.09 

-.01 

12. Conteo de grupos de puntos 

.02 

.80 

.20 

.03 

.00 

11 . Claves (velocidad perceptual) 

.18 

.64 

.05 

.30 

.17 

13. Mayiisculas rectas y curvadas 

.19 

.60 

.40 

-.05 

.18 

24. Problemas aritmbtlcos 

.41 

.54 

.12 

.16 

.24 

21. Acertijos numdricos 

.18 

.52 

.45 

.16 

.02 

18 Numero-figura 

.00 

.40 

.28 

.38 

.36 

1. Percepcibn visual 

.17 

.21 

.69 

.10 

.20 

2. Cubos 

.09 

.09 

.65 

.12 

-.18 

4. Banderas 

.26 

.07 

.60 

-.01 

.15 

3. Tablero con lormas de papal 

.16 

-.09 

.57 

-.05 

.49 

23. Completamiento de series 

.42 

.24 

.52 

.18 

.11 

20. Deduccibn 

.43 

.11 

.47 

.35 

-.07 

15. Reconocimiento de mimeros 

.11 

.09 

.12 

.74 

-.02 

14. Reconocimiento de palabras 

.23 

.10 

.00 

.69 

.10 

16. Reconocimiento de figuras 

.07 

.07 

.46 

.59 

.14 

17. Objeto-numero 

.15 

.25 

-.06 

.52 

.49 

19. Figura-palabra 

.16 

.16 

.11 

.14 

.77 

Nota: las cltras on negritas sigratican subpruebas con una loerle carga on cada laclor 

los datos basados en medidas triviales, irrele- calidad de la informacibn que se ingresa. Se 


vantcs o fortuitas. Si no existe oro quc encon- 
trar, entonces no se encontrard nada: el andlisis 
factorial no es alquimia; producird resultados 
significativos s6lo cuando la investigacidn ha- 
ya sido significativa desde un principio. 

Un aspecto importante es que sdlo puede 
surgir un tipo particular de factor a partir de! 
andlisis factorial si, para empczar, las pruebas 
y medidas contiencn esc factor. Por cjemplo. 
no es posiblc que surja un factor de memoria 
a corto plazo a partir de una baterfa de prueba 
de capacidad, si ninguna dc la prueba requie- 
re de esc tipo de memoria. En general, la cali- 
dad de la informacidn obtenida depende de la 


glas BEBS “basura quc entra, basura que sale”. 

La magnitud de la muestra es importante 
para un andlisis factorial establc. Comrey (1973) 
ofrece la siguiente gui'a aproximada: 


Magnitud de la muestra 

Clasificacidn 

50 

muy deficiente 

100 

deftcicnte 

200 

adecuada 

300 

buena 

500 

muy buena 

1 000 

excelente 
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En genera], es reconfortante tener cuando 
mcnos cinco personas por cada prueba o varia¬ 
ble (Tabachnick y Fidell, 1989). 

Por ultimo, no se puede enfatizar el grado 
en que cl anilisis factorial se gufa por las elec- 
ciones subjetivas y los prcjuicios tedricos. Una 
cuestidn importante al respecto es la eleccidn 
entre los cjes ortogonales y los ejes oblicuos. Con 
los ejcs ortogonales, los factores se encuen- 
tran en Angulos rectos entre sf, lo cual significa 
que no estin correlacionados (las figuras 8-1 y 
8-2 presentan este tipo de ejes). En muchos 
casos, los agrupamientos de cargas factoriales 
estin situados de tal manera, que los ejes obli¬ 
cuos proporcionan una mejorcorrespondencia. 
Con dstos, los factores se correlacionan entre sf. 
Algunos investigadores sosticncn que siempre 
deberian utilizarse estos ejes, mientras otros asu- 
men un enfoque mis experimental. Tabachnick 
y Fidell (1989) rccomiendan una estrategia cxplo- 
ratoria basada en anilisis factoriales repetidos. 
Su enfoque es descaradamcntc oportunista: 

Durante algunas secuenclas subsecuentes, los 
Investigadores experimentan con diferentes nu- 
meros de factores, diferentes ttcnicas de extracctin 
y rotaclones tanto ortogonales como oblicuas. 
Cierto numero do factores con alguna combinactdn 
de extraccibn y rotacibo produce la solucidn coo 
la mayor utilkfad, consistencia y slgnlficado cien- 
tfficos; bsta es la solucibn que se interprets. 

Con las rotacioncs oblicuas tambidn es posible 
realizar un anilisis factorial de los factores en 
sf. Dicho proccdimiento puede producir uno o 
mis factores de segundo orden, que pueden 
apoyar la organizacidn jcrirquica de los rasgos 
y ofrecer un acercamiento entre los tedricos 
que postulan un solo factor general (p. ej.. 
Spearman) y aquellos que promueven varios 
factores grupales (p. ej., Thurstone). Quizis 
ambos bandos estdn en lo correcto, con los fac¬ 
tores grupales colocados por debajo de un 
factor general de segundo orden. 

I BATERIAS DE PRUEBA 
DE APTITUDES MULTIPLES 

Como se sefiald antes, las pruebas de aptitud 
no florecieron hasta que se tuvieron disponi- 


bles las herramientas estadfsticas —procedi- 
mientos de anilisis factorial— que constitufan 
un prerrequisito. Una de las principales aplica- 
ciones del anilisis factorial fue el desarrollo de 
las baterfas de prueba de aptitudes multiples, 
en las cuales se examina a la persona en varias 
ireas independientes y homogdneas de aptifud. 
El desarrollo de las subpruebas se inspira en 
las conclusiones del anilisis factorial. Porejcm- 
plo, Thurstone desarrolld una de las primeras 
baterfas de prueba de aptitudes multiples, la 
Prueba de Habilidades Mentales Primarias, un 
conjunto de siete pruebas clegidas con base 
en el anilisis factorial (Thurstone, 1938). 

Recientemente, varias baterfas de aptitudes 
multiples han obtenido popularidad para la 
oricntacidn cducativa y vocacional, asignacidn 
vocacional y clasificacidn en las fuerzas arma¬ 
das (Gregory, 1994a). Cada ano, a cientos de 
miles de personas se les aplica una de estas 
importantes baterfas: el Test de Aptitudes Di- 
ferenciales (DAT), la General Aptitude Test 
Battery, GATB (Baterfa de prueba de aptitud 
general) y la Armed Services Vocational 
Aptitude Battery , ASVAB (Baterfa de aptitud 
vocacional de las fuerzas armadas). Estas bate¬ 
rfas utilizaron cl anilisis factorial, ya fucra de 
manera directa para establecer las subprue¬ 
bas utiles o se guiaron en su construccidn de 
los resullados acumulados en otras investiga- 
ciones analftico-factoriales. Las caracterfsticas 
sobresalienles de cada baterfa sc resumen bre- 
vemente en las siguientes secciones. 

TEST DE APTITUDES DIFERENCIALES 
(DAT) 

El DAT sc publied inicialmcnte en 1947 para 
proporcionar una base para la orientacidn cdu¬ 
cativa y vocacional de los alumnos de bachille- 
rato. Despuds, los examinadores encontraron 
que esta prueba es litil en la orientacidn voca¬ 
cional de jdvenes adultos que se encuentran 
fuera de la escucla y en la seleccidn de emplea- 
dos. La prueba ha tenido revisiones periodic as 
y es una de las baterfas de prueba de aptitu¬ 
des multiples mis popular de todos los tiempos 
(Bennett, Seashore y Wesman, 1982, 1984). 
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El DAT incluye ocho pruebas independicn- 

tes: 

1 . Razonamiento Verbal (RV). 

2. Razonamiento Numdrico (RN). 

3. Razonamiento Abstracto (RA). 

4. Velocidad y Precisidn Perceptual (VPP). 

5. Razonamiento Mecflnico (RM). 

6. Relaciones Espacialcs (RE). 

7. Ortograffa (O). 

8. Uso del lenguaje (UL). 

En la figura 8-3 se mucstra un rcactivo carac- 
terfstico de cada prueba. 

Los autores eligieron las areas para las ocho 
pruebas con base cn datos expcrimentales y 
expericnciales. nuls que en un andlisis factorial 
formal rcalizado por ellos mismos. En la cons- 
truccidn del DAT, los autores se guiaron por 
varios crilerios explfcitos: 

• Cada prueba dcbc scr indepcndienie: existen 
situaciones en las que se requicrc o se dcsea 
sdlo una parte de la baterfa. 

• Las pruebas deben medir poden para la ma¬ 
yor parte de los propdsitos vocacionalcs a los 
que contribuyen los resultados de una prue¬ 
ba, la evaluaci6n del poder —resolver pro- 
blcmas diffcilcs cn cl ticmpo adccuado— es 
de intcrds primordial. 

• La baterfa de prueba dcbe producir un perfil: 
las ocho calificaciones independientes pueden 


convcrtirse en rangos percentiles y represen- 
tarse en una grdfica comun de perfil. 

• Las normas deben ser adecuadas: en la quinta 
edicidn, las normas se obtuvieron de 100 000 
estudiantes para la estandarizacidn de otofio 
y 70 000 para la de primavera. 

• Los materiales de prueba deben ser prticticos: 
con Ifmites de tiempo de 6 a 30 minutos por 
prueba, el DAT completo puede aplicarse en 
una sesidn escolar matutina o vespertina. 

• Las pruebas deberfan ser f&ciles de aplicar. 
cada una contiene excclentes ejemplos de “ca- 
lentamiento” y las pueden aplicar personas 
con un mfnimo de entrenamiento especial. 

• Deben estar disponibles formas alternas: con 
propdsitos de repeticidn de prueba, la dispo- 
nibilidad de formas alternas (en la actualidad 
formas C y D) reducirfi cualcsquicr cfcctos 
de la prjctica. 

La confiabilidad del DAT cs, por lo general, 
bastante aita, con coeficientes por mitades que 
en gran medida se localizan en el rango de .90 
y confiabilidades de formas alternas que se en- 
cuentran en cl rango de .73 a .90, con mediana 
de .83. Razonamiento mccAnico es una excep- 
cidn, con confiabilidades tan bajas como .70 
en el caso de las nihas. Las pruebas muestran 
un patrdn mixto de intercoirelaciones, que los 
autores interpretan de manera optimista co¬ 
mo una confirmacidn de la independence de 
las ocho pruebas. En realidad, muchas de las 


RAZONAMIENTO VERBAL 

Eli|a el par oorrecto de palabras para Denar los espaclos en bianco. 

La _ es a la vista lo que el timpano es at_ 

A. vision — sonldo D. vista — eddoa 

B. iris — audlcldn E. pestaAa — Idbulo 

C. retina — olcto 

CAPACIDAD NUMERICA 
Ell|a la respuesta corrects 

4t-6)(-3). 

A.-60 B. 27 C.-27 Q. 60 E. Nlnguna de ias anteriores 


Figura ft-3. Test de Aptitudes diterenciales y Reactivos caractoristicos 
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RAZONAMIENTO ABSTRACTO 

Las cuatro liguras on la fila a la izqulerda constrtuyen una serle Encuentra La Orica opdOn a 
la derecha que continuarla la serie 

< <» «» <o>» o «o> <«»» ««»» 

ABC D 


VELOaDAD Y PRECISION EN TRABAJOS DE OF1CINA 

En cada readlvo de la prueba, una do las comblnadooes se encuentra subrayada Marque la 
mlsma combinacxJn en la t»|a de respoesta 

1 AB Ab AA BA Bb 2 5m 5M M5 Mm m5 

Ab Bb AA BA AB M5 m5 Mm 5m 5M 

1. OOOOO 2.00 O O O 


RAZONAMIENTO MECANICO 

iCuil palanca requerlra mayor fuerza para levanlar un objeto del mismo peso? De ser tgual. 
marque C. 



A C (igual) B 


RELACIONES ESPACIALES 

tCuai de las flguras de la derecha se puede hacer al doblar el patrdn a la Izqulerda? El patrdn 
siempre representa la parte externa de la ligura 



A B C D 


ORTOGRAFlA 

Marque si cada palabra estd escnta de manera cor recta o incorreda 

1 irelevanle C I 

2. parsirnonioso C I 

a Exselente C | 


USO DEL LENGUAJE 

Declda quo parte de la oraofln eontlene un error y marque la letra correspoodlente en la hoja 
de respuesta Marque N (nlnguna)» no existe error 

A pesar de la crltlca del publrco/ el investigador estudicv 

A B 

tos atedos de la radiacidrV sobre el crecimiento de las plantas 
C D 


Flgura 8-3. Test de Aptitudes dllerenciales y Reactivos caracteristtcos (conlinuac*6n). 























correlaciones son bastante altas y parecc proba¬ 
ble que las ocho prnebas reflejen un menor nti- 
mero de factores de capacidad. Con toda 
seguridad, las pruebas de Razonamicnto Verbal 
y Capacidad numdrica miden un solo factor s6- 
|ido, con correlaciones alredcdor de .70 en di- 
versas muestras. 

El manual prcscnta amplios datos quc dc- 
muestran que las pruebas del DAT, en especial 
la combinacidn RV + RN. constituyen buenos 
medios de prediction de las calificaciones en 
educacidn media superior y uni versidad (corre¬ 
laciones en los rangos de .60 y .70). Por tal ra- 
z6n. la combinacidn de RV + RN se considcra 
con frecuencia como un fndice de la aptitud 
escolar. La cvidencia de la validez diferencial 
de las otras pruebas es bastante limitada. 
Bennett, Seashore y Wesman (1974) sf presen- 
lan los resultados de varios estudios de segui- 
miento en los que se corrclaciona cl ingreso a la 
universidad/dxito con los perfiles del DAT. pero 
sus mdtodos de investigation son mds impre- 
sionistas quc cuantitativos; cl observador inde- 
pendiente tendril dificultades para utilizar sus 
resultados. Schmitt (1995) sehala que uno de los 
principals problemas con la bateria es la 

... falta de validez discnmlnativa entre las ocho 
subpruebas. Con excepcibn de la prueba de 
Vetocidad y Preclsibn Perceptual, todas las sub- 
escalas lienen fuertes Intercorrelaciooes (.60 a 
.75). Si sblo se qulere obtener un Indlce general 
de la capacidad acadbmica de la persona, 
esto es adecuado; si las calificaciones en las 
subpruebas han de utilizarse en algiin sentido 
diagnbstlco, este nivel de intercorrelacibn hace 
que las afirmaciones sobre las fortalezas y debl- 
lidades relatlvas de los estudiantes sean alia men- 
to cuestlonables. 

Aun asf, el DAT revisado es mejor que las edi- 
ciones anteriores. Una mcjorfa importances la 
elimination del aparente sesgo de genera en las 
pruebas dc Uso del Lenguaje y Razonamiento 
Mccbnico —una fuentc de crfticas en ediciones 
anteriores. Los cditorcs de la Quinta EdiciOn 
Hevaron a cabo un cuidadoso cstudio sobre ses¬ 
go de gOnero, raza, Otnico y regional, a fin de 
eliminar los reactivos quc podrfan ser eslcrco- 
tipicos u ofensivos para subgrupos idcntificables. 
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Lo que es mds, realizaron andlisis estadfsticos 
complejos para eliminar reactivos de dificultad 
desigual entre subgrupos raciales cquiparados 
en terminos de desempeno general. 

BATERIA DE PRUEBA DE APTITUD 
GENERAL (GATB) 

A finales del decenio de 1930, cl Departamento 
del Trabajo de EUA desarrollO pruebas dc ap¬ 
titud para prcdecirel desempcrlo laboral en 100 
ocupacioncs espccfficas. En el decenio dc 1940, 
el departamento contratO a un panel dc expertos 
en mcdici6n y psicologfa industrial-organi- 
zacional para crear una baterfa de prueba de 
aptitudes multiples quc evaluara las 100 ocupa¬ 
cioncs antes estudiadas y muchas mds. El rc- 
sultado dc este esfuerzo titdnico fue la General 
Aptitude Test Battery , GATB (Baterfa de Prue¬ 
ba de Aptitud General), ampliamente conocida 
como la principal bateria de prueba para la pre- 
diccion del desempefio en el trabajo (Hunter, 
1994). 

La GATB se obtuvo de un andlisis factorial 
de 59 pruebas aplicadas a miles dc aprcndices 
varones en cursos vocacionales (.UnitedStates 
Employement Service, 1970). Las normas in- 
terpretativas se han revisado y actualizado de 
manera periddica, dc modo que la GATB es un 
instrumento totalmente moderno, aunque su 
contcnido haya cambiado muy poco. Una limi- 
tacidn es que la bateria estd disponiblc princi- 
palmente para oficinas gubernamcntales de 
empleo, aunque organizaciones no lucrativas, 
incluycndo bachilleratos y cicrtas universida- 
des, pueden llegar a arrcglos cspcciales para 
utilizarla. 

La GATB se integra de ocho pruebas de 
Idpiz y papel y cuatro medidas con aparatos. 
La bateria complcta puede aplicarsc en aproxi- 
madamente dos horas y media y es apropiada 
para estudiantes de bachillerato y adultos. Las 
12 pruebas producen un total de nueve califi¬ 
caciones factoriales: 

• Capacidad general dc aprendizaje (inteli- 
gencia) (G). Esta calificacion es una combi- 







334 • Evaluation psicologica: Historla, prlnclplos y apllcaclones 


(Capitulo 8) 


nacidn de Vocabulario. Razonamiento aritmd- 
tico y Espacio tridimensional. 

• Aptitud verbal (V). Obtenida de la prueba 
de Vocabulario que requiere que la persona 
indique las dos palabras que en un conjunto 
son sindnimos o antdnimos. 

• Aptitud numdrica (N). Esta calificacidn es 
una combinacidn de las pruebas de Cdlculo y 
Razonamiento Numdrico. 

• Aptitud espacial (E). Consla de la prueba de 
Espacio Tridimensional, una medida de la 
capacidad para percibir representaciones 
bidimcnsionales de objetos tridimensiona- 
les y de visualizar el movimiento en tres di- 
mensiones. 

• Perccpcidn de la forma (P). Esta califica- 
cidn es una combinacidn de Equiparaci6n de 
Formas y Equiparacidn de Herramicnlas, dos 
pruebas en las que la persona debe equiparar 
dibujos iddnticos. 

• Percepcion en trabajos de oficina (Q). Una 
prueba de corrcccidn llamada Comparacidn 
de nombres en la que el individuo tiene que 
equiparar nombres bajo presidn de tiempo. 

• Coordination motora (K). Mide la capaci¬ 
dad para hacer con rapidez marcas espeeffi- 
cas con un ldpiz en la prueba de Marcado. 

• Destreza digital (D). Una combinacidn de 
las calificaciones dc las pruebas de Armado 
y Desarmado, dos medidas de destreza con 
remaches y arandelas. 

• Destreza manual (M). Una combinacidn dc 
las calificaciones de las pruebas de Colocar 
y Girar, dos pruebas que requicrcn que la 
persona transfiera e invierta clavijas en un 
tablero. 

Las nueve calificaciones factoriales en la GATB 
se expresan como puntuaciones estdndar con una 
media de 100 y DE dc 20. Estas puntuaciones 
estdndar sc sustentan en la muestra normativa 
original de 4 000 trabajadores que se obtuvo en 
el decenio de 1940. Los coeficientes de confia- 
bilidad de formas alternas van desdc el rango 
de .80 hasta el de .90. El manual de la GATB 
resume varios cstudios de validez acerca de la 
prueba, principalmente en tdrminos de su co- 


rrelacidn con medidas pertinentes dc criicrio, 
Hunter (1994) seftala que las calificaciones de 
la GATB predicen el dxito del entrenamiento 
para todos los niveles de complejidad laboral, 
El coeficiente promedio dc validez es un feno- 
menal .62. 

Las calificaciones absolutas son dc menor 
interns que su comparacidn con los Putrones 
de Aptitud Laboral (PAL) actuates para doce- 
nas de trabajos. Con base en los rcsultados dc 
grandes muestras de solicitantes y empleados 
en diversas ocupaciones, los orientadores y cm- 
pleadores pueden tener acceso en la actualidad 
a un cumulo de informacidn acerca de patro- 
nes de calificacidn que son necesarios para el 
<Sxito en una variedad de puestos. Asf, una ma- 
nera de utilizer la GATB consiste en comparar 
las calificaciones de una persona examinada con 
los PAL que se considcran necesarios para la 
destreza en diversas ocupaciones. 

Hunter (1994) recomienda una estrategia 
nltcmativa basada en aptitudes combinadas (fi¬ 
gure 8-4). Las nueve puntuaciones factoriales 
cspeci'ficas se combinan muy bien en tres fac- 
torcs generales: cognitivo, perceptual y psico- 
motor. Hunter senala que los diferentes puestos 
requieren diversas capacidades de estas aptitu¬ 
des. Por ejemplo, un obrero en una Knea dc 
ensamblado en una planta automotriz podrfa 
nccesitar alias calificaciones en las combine- 
ciones psicomotora y perceptual, mientras la 
puntuacidn cognitiva serfa menos importante 
para su trabajo. La investigacidn de Hunter de- 
mucslra que los factores generales dominan 
sobre los cspecfficos en la prediccidn del de- 
sempeno laboral. Davison, Gasser y Ding 
(1996) estudian enfoques adicionales para el 
anAlisis e intcrprctacidn del perfil de la GATB. 

Van dc Vijver y Harsveld (1994) invesliga- 
ron la equivalence de su versidn por computado- 
ra de la GATB con la versidn tradicional de 1 i- 
piz y papcl. Por supuesto, sdlo sc compararon 
las subpruebas cognitivas y perceptualcs —las 
pruebas de habilidad molriz no pueden trasla- 
darse a computadora. Estos autores encontraron 
que las dos versiones no cran equivalentes. En 
particular, las subpruebas por computadora pro- 
duefan respuestas m4s rdpidas e imprecisas que 




' 
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FACTORES ESPEClFICOS FACTORES QENERALES 


Q Capaodad general de aprendua|e (inlokgenda) 
V Aplllud verbal 
N Aptilud numerics 


-Cognitive? 


E Aptilud er.paci.il 
P PercepciOn de forma 
O PercopcMn de Irabajos de oficina 


-Perceptual 


K CoordinactOn motors 
D Destreza digital 
M Destreza manual 


-Psicomotor 


Flgura 8-4. Factores especificos y generates en la GATB. 


las subpruebas convencionales. Su investiga- 
ci6n demuesira una vcz mils que no puede 
suponerse la cquivalencia entre las versiones 
tradicional y por compuladora dc una prueba. 
6sta es una pregunta empirics que sdlo puede 
responderse a travds de investigacidn cuidado- 
sa. Nijenhuis y van der Flier (1997) estudian 
una versidn holandesa de la GATB y su aplica- 
cidn para el estudio dc diferencias cognitivas 
entre inmigrantes y miembros del grupo mayo- 
ritario cn los Pafses Bajos. 

BATERIA DE APTITUD VOCACIONAL 
DE LAS FUERZAS ARMADAS 

Li Armed Services Vocational Aptitude Battery, 
ASVAB (Baterfa de Aptitud Vocacional de las 
Fuerzas Armadas) es probablcmente la prueba 
de Idpiz y papel dc uso mils arnplio que se ten- 
ga cn existencia. Las Fuerzas Armadas la utili- 
zan para seleccionar a reclutas potenciales y 
asignar personal a diferentes trabajos y progra¬ 
ms dc entrenamiento. Mds de dos millones de 
personas responden la ASVAB cada ano. La 
versidn actual consistc en 10 subpruebas, cua- 
tro de las cualcs producen la Armed Forces 
Qualification Test, AFQT (Prueba de Capaci- 
tacidn para las Fuerzas Armadas), cl examen 
comun de capacidad para todos los servicios 


dentro del cjdrcito (cuadro 8-5). Ocho sub¬ 
pruebas son de poder con Ifmites de tiempo 
adecuados para la mayorfa de las personas, 
mientras dos (Operaciones Numdricas y Velo- 
cidad de Codificacidn) son con Kmite de 
tiempo que le dan gran importancia al desem- 
peno rdpido. Los coeficientes de confiabilidad 
de formas altemas para las calificaciones dc la 
ASVAB se encuentran aproximadamente entre 
.85 y .95, y los coeficientes test-retest van desdc 
mitad del rango de .70 hasta mitad del rango 
dc .80 (Larson, 1994). La unica excepcidn es 
Comprensidn de Ptirrafos, con una confiabili¬ 
dad de s6lo .50. La prueba ticnc buenas nor- 
mas basadas en una mucstra representativa 
de 12 000 personas entre los 16 y 23 aflos de 
edad. El manual de la ASVAB presenta un co- 
eficiente mediano de validez de .60 con medi- 
das del desempeno en el entrenamiento. 

Las decisiones acerca dc las personas exa- 
minadas con la ASVAB se basan por lo comun 
en puntuaciones mixtas, no en calificaciones de 
subprueba. Por ejemplo, la puntuacidn mixta 
de trabajos de oficina se obtienc dc la combina- 
ci6n de Conocimiento de Palabras, Compren- 
sidn de Pdrrafos, Operaciones Numdricas y 
Velocidad dc Codificacidn. Los individuos que 
tienen alias calificaciones cn esta combinacidn 
podrfan asignarse a puestos secretariales. Dado 
que las puntuaciones mixtas se obticnen a nivel 
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Cuadro 8-5. Subpruebas de la Bateria de Aptitud Vocacional de las 
Fuerzas Armadas (ASVAB) 


Razonamiento aritmdtico* 

Conocimienlos malemdticos* 

Comprensidn de pdrrafos* 

Conocimiento de palabras* 
Velocidad de codificacidn 

Ciencia general 

Operaciones numdricas 

Informacidn sobre electrdnica 

Comprensidn mecdnica 
Informacidn aulomolriz y mecdnica 


prueba con 30 reactivos de problemas arilmdtlcos expresados en 
palabras, basados en cdlculo simple 
prueba con 25 reactivos de dlgebra, geomelrfa, fracciones, deci¬ 
mates y exponentes 

prueba con 15 reactivos de comprensidn de lectura en pdrrafos 
cortos 

prueba con 35 reactivos de conocimiento de vocabulario y sindnimos 
prueba de velocidad con 84 reactivos de sustitucidn de claves 
numdricas por verbales 

prueba con 25 reactivos de conocimientos generates en ciencias 
ffsicas y bioldgicas 

prueba de velocidad con 50 reactivos de capacidad para sumar, 
restar, mulliplicar y dividir 

prueba con 20 reactivos sobre principios de electrdnica, radio y 
elect ricidad 

prueba con 25 reactivos sobre principios mecdnicos y fisrcos 
prueba con 25 reactivos de conocimientos bdsicos sobre automd- 
viles, praclicas en un taller y utilizacion de herramientas 


• Armed Forces OuaMying Test AFQT (Prueba de Aptiludes para las Fuerzas A/madas) 


empfrico, en cualquier momento pueden dc- 
sarrollarse nuevas calificaciones para la toma 
de decisioncs sobre asignacidn a un trabajo. Las 
punluacioncs mixtas se actualizan y revisan con- 
tinuamente. Porejemplo. Rec y Carretta (1994) 
defienden la presencia de ires puntuacioncs 
mixtas obtenidas de un andlisis factorial de mds 
de 11 000 participantes en la evaluacidn con la 
ASVAB. Estas y las subpruebas que las consti- 
tuyen son las siguientes: 

1. Velocidad: Operaciones Numdricas y Veloci¬ 
dad de Codificacidn. 

2. Verbal/Matcmdticas: Razonamiento Aritmdti- 
co, Conocimiento de Palabras, Comprensi6n 
de Pdrrafos y Conocimiento Matemdtico. 

3. Conocimiento tdcnico: Ciencia General, In- 
formacidn Automotriz y Mecdnica, Com¬ 
prensidn Mecdnica e Informacidn sobre 
Electrdnica. 

El lector observard que cl segundo factor es 
igual al de la AFQT, mencionado antes. 


En algun momento, las Fuerzas Armadas 
dependieron en gran medida de las siete pun- 
tuaciones mixtas que se listan a continuacidn 
(Murphy, 1984). Las primeras tres constituyen 
puntuaciones mixtas acaddmicas, mientras las 
restantes son puntuacioncs mixtas laborales. El 
lector verd que las subpruebas individuales pue¬ 
den aparccer en mds de una combi nacidn: 

1. Capacidad acaddmica: Conocimiento de Pa¬ 
labras, Comprensidn de Pdrrafos y Razona¬ 
miento Aritmdtico. 

2. Verbal: Conocimiento de Palabras, Compren¬ 
sidn de Pdrrafos y Ciencia General. 

3. Matcmdticas: Conocimiento Matcmdiico y 
Razonamiento Aritmdtico. 

4. Mecdnica y oftcios: Razonamiento Aritmd¬ 
tico, Comprensidn Mecdnica, Informacidn 
Mecdnico-Automotriz e Informacidn sobre 
Electrdnica. 

5. Negocios y oficina: Conocimiento de Pala¬ 
bras, Comprensidn de Pdrrafos, Conocimien¬ 
to Matemdtico y Velocidad dc Codificacidn. 
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6. Elcctrdnica y electricidad: Razonamiento Arit- 
mitieo, Conocimiento Matematico, Informa- 
cion sobrc Electrdnica y Ciencia General. 

7. Salud. sociedad y tecnologfa: Conocimiento 
de Palabras, Comprensi6n de Pirrafos, Ra¬ 
zonamiento Aritmdtico y Comprensidn Me- 
cinica. 

El problema con la formacidn de combinacio- 
n cs de esta manera es que se correlacionan en 
tal grado unas con otras que se vuelven esen- 
cialmente redundantcs. De hecho, la intercorre- 
lacidn promedio entre cstas siete puntuacioncs 
mixtas esdc j.86! (Murphy, 1984). Esclaro que 
las puntuaciones mixtas no sienipre proporcionan 
mformacion diferencial acerca de aptitudes es- 
pecificas. Quizes dsta es la razdn por la que las 
ediciones recientes de la ASVAB han evitado 
las puntuaciones mixtas multiples y complejas. 
En vez de ello, el infasis se ha colocado en pun¬ 
tuaciones mixtas mis sencillas que se compo- 
ncn de constructos sumamente relacionados. Por 
ejemplo, la puntuacidn mixta de Capacidad Ver¬ 
bal se obtiene de Conocimiento de Palabras y 
Comprcnsidn de Pirrafos, dos subprucbas con 
elevada relacidn entre sf. De manera similar, la 
puntuacidn mixta en Capacidad Matemitica se 
obtiene de la combinacidn de Razonamiento 
Aritm^tico y Conocimiento Matemitico. 

Algunos investigadores han concluido que 
la ASVAB no funciona como una baterfa de 
prueba de aptitudes multiples, pero logra tener 
dxito en predecir di versas tareas militarcs dcbi- 
do a que las puntuaciones mixtas detectan, in- 
variablcmcntc, un factor general de inteligencia. 
La ASVAB puede ser una muy buena prueba 
de inteligencia general, pero no logra ser una 
baterfa de aptitudes multiples. Otra preocupa- 
ci6n es que la prueba puede posccr diferentes 
estructuras psicomdtricas para varones y muje- 
res. Especfficamcntc, la subprueba de Informa- 
ci6n sobre Electrdnica es una buena medida de 
g (el factor general de inteligencia) en el caso 
de los varones, pero no en el de las mujeres 
(Rce y Carretta, 1995). La posible explication 
de esto es que aqudllos tienen una probabilidad 
nueve veces mayor de inscribirse en clases de 
electrdnica y taller automotor en la secundaria 
y, por tanto, tienen la oportunidad de que su 


capacidad general moldce aquello que han 
aprendido, mientras las mujeres no la tienen. 
Asf, las calificaciones cn cstas subpruebas fun- 
cionardn como una medida del rendimiento 
(aquello que ya se ha aprendido), pero no como 
un fndice de aptitud (prediccidn de resultados 
futures). 

Dcsdc cl decenio de 1980 ha estado en pro- 
ceso una investigacidn sobre una Prueba 
Adaptativa Computarizada (CAT), que es una 
versidn de la ASVAB. Esta prueba se analiza 
en cl tema 15A, Evaluacidn por computadora y 
el future de las pruebas. Aquf se proporciona 
un resumen. En la CAT, la persona realiza la 
prueba mientras esti sentada en una terminal 
de computadora. El nivel de dificultad de los 
reactivos que aparecen en pantalla se reajusta 
de manera continua en funcidn del desempeno 
que va presentando el indi viduo examinado. En 
general, una persona que respondc bien a un 
reactivo de subprueba, recibiri uno mis diffcil, 
mientras que alguien que no lo hizo red bird otro 
mis sencillo. La computadora utiliza la teorfa 
de respuesta al reactivo como una base para la 
seleccidn de reactivos. Cada individuo exami¬ 
nado recibe un conjunto unico de reactivos de 
prueba disefiado para su nivel de capacidad. 

La CAT-ASVAB se sometid a prueba en 
un limitado numcro de lugarcs. Larson (1994) 
detalla las razones para adoptar la CAT- 
ASVAB: 

1. Reduce el tiempo total de la prueba (las prue¬ 
bas ajustables requieren aproximadamente la 
mi tad de los reactivos que aqudllas estandar). 

2. Aumenta la seguridad de la prueba al elimi- 
nar la posibilidad de que alguien robe los 
protocolos de la misma. 

3. Aumenta la precisidn de prueba en los extre- 
mos superior e inferior de capacidad. 

4. Proporciona un medio para realimcntacibn 
inmediata de las calificaciones de la prueba, 
dado que las computadoras utilizadas para cl 
examen pueden calificar de inmediato la 
prueba y dar los resultados. 

5. Proporcionan un medio para flexibilizar los 
tiempos de inicio de la prueba (a difcrcncia 
de las pruebas de lipiz y papel aplicadas de 
manera grupal, dondc todos deben comenzar 
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y terminar cn cl mismo momento, las pruc- 
bas basadas cn computadora pucden disc- 
narsc para los horarios pcrsonales de los 
individuos evaluados). 

El dxito o fracaso de la CAT-ASVAB puede 
tener implicaciones trascendentales para las 
pruebas en general. Si el proyecto ticnc dxito, 
es probable que la ASVAB y otras pruebas sc 
amplfen a fin de medir nuevos aspectos del de¬ 
sempeno, como las latencias de respuesla, y 
que presenten tipos linicos de reactivos como 
pruebas visoespaciales de objetos en movimien- 
to (Larson. 1994). La CAT-ASVAB ticne el po- 
tencial de cambiar el futuro de las pruebas. 


■ PREDICabN Da DESEMPENO 
ENLAUNIVERSIDAD 


Como sabe casi cualquicr estudiante universi- 
tario, uno de los principales usos de las prue¬ 
bas de aptitud es la prediccidn del desempeno 
academico. En la mayor parte de los casos, los 
aspirantes a una universidad deben enfrentarse 
con los programas de evaluacidn de las 
Scholastic Assessment Test, SAT (Pruebas de 
Evaluacidn Escolar) o la American College Test, 
ACT (Prucba Universitaria Estadounidense). Es 
posible que las instituciones establezcan nor- 
mas mfnimas de admisidn para las pruebas SAT 
o ACT, con base en cl conocimiento de que las 
bajas calificaciones predicen el fracaso en la 
universidad. En esta seccidn se analizaia la ido- 
neidad tdcnica y la validez predictiva de las prin¬ 
cipales pruebas de aptitud para la universidad. 

PRUEBAS DE EVALUAC16N ESCOLAR 

Conocida antes como Scholastic Aptitude Test, 
SAT (Pruebas de Aptitud Escolar), la Scholastic 
Assessment Test, SAT (Pruebas de Evaluaci6n 
Escolar) son las m£s antiguas de las pruebas de 
admisidn a la universidad, ya que daian de 1926. 
La Junta Universitaria (antes conocida como 
Junta de Examen de Ingreso a la Universidad), 


un grupo formado en 1899, publied las SAT 
para establecer un centra nacional de informa- 
ci6n para las pruebas de admisidn. Como lo 
sefiald el historiador Fuess (1950), el propdsito 
de una prueba de admisidn a nivcl nacional era 
“introducir orden y concierto en una annrquia 
cducativa que hacia finales del siglo XIX se 
habfa vuclto exasperante, de hecho casi into¬ 
lerable, para los catedidticos”. A travds de los 
anos, la prucba se ha revisado de manera cx- 
tensa, con actualizaciones continuas y renorma- 
tizaciones repetidas. A principios del decenio 
de 1990, se cambi6 el nombre de las SAT por 
cl de Scholastic Assessment Test para enfatizar 
los cambios en contenido y formato. La nueva 
SAT evalua el dominio en materias de educa- 
cidn media en mayor grado que su antccesora, 
pero continua dirigidndo.se a las habilidades de 
razonamiento. La SAT representa la vanguar- 
dia de las pruebas de aptitud. 

La nueva SAT consta de las Pruebas de 
Razonamiento SAT-1 y las Pruebas T'emdticas 
SAT-D. La Prueba de Razonamiento Verbal de la 
S AT-I enfatiza vocabulario dcnlro de un contex- 
to, comprensidn de lectura y razonamiento critico. 
Razonamiento Matemdtico de la SAT-1 enfatiza 
la aplicacidn de conceptos matemdticos, inter- 
prctacidn de datos y construccidn real de una 
respuesta, cn contraposici6n al formato tfpico 
de opci6n multiple. Se recomienda mucho el uso 
de una calculadora, pero esto no es obligatorio. 

Las calificaciones de Razonamiento Ver¬ 
bal y Razonamiento Matemdtico de la SAT-1 
se presentan en una escala que va de 200 a 800 
puntos. Los tipos de reactivos caracterfsticoi 
de la seccidn Verbal incluyen: 

* Analogfas: seleccionar un par de palabras que 
mejor represenlen una relacidn similar a la 
expresada en un par dc estfmulos. 

* Frases Incompletas: para una oraci6n con 1 o 
2 espacios en bianco, elegir una palabra o par 
de palabras que se ajusten mejor al significa- 
do global de la oracidn. 

* Comprensidn de Lectura: leer una selecci6n 
y responder a preguntas de opci6n multiple 
basadas en lo que se expresd en la seleccidn 
de lectura. 
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Los tipos dc reactivos caracterfsticos dc la sec¬ 
ern de Matemdticas incluycn los siguientes: 

• Matemdticas Regularcs: resolver problemas 
bdsicos de geometn'a y algebra. 
•Comparaciones Cuantilativas: elegirentre dos 
cantidades la mayor o indicar que son iguales 
o que el problems no puede resolverse con la 
informacidn proporcionada. 

Una concepcidn errdnea pcrsistente acerca de 
las calificaciones de la SAT es que 500 y 100 
representan la media y desviacidn estdndar de 
la muesira mis rcciente de personas examina- 
das con la prneba (Donlon, 1984). De hecho, 
los ndmeros 500 y 100 se reficren a la media y 
desviacidn estdndar del grupo de referencia de 
10 654 estudiantes que contestaron la seccidn 
Verbal de la SAT cn abril de 1941. (La seccidn de 
Matemdticas se equipard con esta seccidn al 
ano siguiente.) Todas las nucvas calificaciones 
scequiparan con aqudllas de referencia al vin- 
cular cada nueva forma de la SAT con una o 
mis formas anteriores. Porejcmplo, si una nue¬ 
va forma es un tanto mis ficil que las anteriores, 
puede ser necesario que la persona que rcaliza 
la prueba neccsite algunas respuestas correctas 
adicionales a fin de lograr una calificacidn equi- 
valente. Gste procedimiento garantiza que las 
calificaciones actuates de la SAT se basen en 
la misma escala de medicidn utilizada al inicio 
del procedimiento de referencia en 1941.* En 
1996 se termind de cstablecer la nueva escala y 
se restablecieron las calificaciones dc la SAT. 
Uno de los propdsitos de la nueva escala era 
proporcionar mediciones mis confiables en los 
rangos de calificacidn superior e inferior al 
ampliar el nivel de dificultad de los reactivos 
(Johnson, 1994). 

De un aflo a otro, la calificacidn promedio 
dc las personas evaluadas con la SAT puede 


* Esta prictica difierc del procedimiento que se sigui6 
cn la renormatizacidn de las pruebas dc Cl. Cuando 
una revisidn de una prueba de Cl se estandariza dc 
nuevo. la media de la poblacidn siempre se establece 
en 100, sin considcrar la dificultad comparativa de la 
pmeba revisada y dc su antcccsora. 


ser sustancialmcnte diferente del promedio ori¬ 
ginal de 500. De hecho, las calificaciones de la 
SAT disminuyeron dc manera abrupta de 1963 
a 1980. Para 1980, el promedio en Matemiti- 
cas habia disminuido de 500 a cerca de 465, 
mientras que el promedio Verbal Ueg6 hasta 
420, casi una desviacidn estindar completa con 
respecto al punto inicial. Las calificaciones pro¬ 
medio en ambas escalas han aumentado s61o 
ligeramente desde cntonces. Este fendmeno ha 
cstado sujeto a intenso escrutinio, y revisar to¬ 
das las cxplicaciones que se han proferido esti 
mis alii del alcance de este libro. En general, 
se accptan las siguientes conclusiones: 

* La disminucidn no fue un efecto artificial de la 
dificultad o de la escala de calificaciones de 
la SAT, fue un fendmeno real que afeetd a otros 
dc los principals programas de prueba. 

* La disminucidn fue significativa y constituyd 
un cambio considerable en el desemperio en 
la prueba; el cambio representd un “grave 
deterioro del proceso de aprendizaje cn EU A" 
(Wirtz, 1977). 

* La disminucidn no redujo la validez predicti va 
de la SAT; la prueba mantuvo correlaciones 
adecuadas con el desemperio universitario. 

* Los cambios poblacionales como el aumento 
en el tamario de las familias pueden explicar 
parte de la disminucidn en calificaciones; si 
el tamario promedio de las familias conlinda 
reduciendose, se predice que las calificacio¬ 
nes de la SAT aumentardn (Zajonc, 1976; 
Zajonc, Markus y Markus, 1979). 

* Los cambios sociales como la expansidn de 
la televisidn pueden haber contribuido a la 
disminucidn cn calificaciones; no obstante, 
tales hipdtesis son diffeiles de probar (Donlon, 
1984). 

Se ha cuidado la construccidn dc las nuevas 
formas de las pruebas Verbal y de Matemdticas 
de la SAT, debido a que una confiabilidad a toda 
prueba y un alto grado de paralclismo son esen- 
ciales para la misidn de este programa dc pnic- 
bas. La confiabilidad de consistencia interna de 
ambas formas se encuentra de manera repetida 
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en el rango de .91 a .93; con algunas except io- 
nes, las correlacioncs test-retest varfan entre .87 
y .89. El error estdndar de mcdicidn es de 30 a 
35 puntos. 

La principal cvidcncia de la validez de la 
SAT se relaciona con el criterio, en este caso la ca- 
pacidad para predecir las calificacioncs en el 
primer ano de universidad. Donlon (1984, ca- 
pftulo VIII) presenta un cumulo de informa- 
ci6n accrca de este punto; en este caso sdlo 
pueden resumirse las (endcncias. En 685 estu- 
dios, las calificacioncs combinadas Verbal y de 
Matemdticas de la SAT se correlacionaron, en 
promedio, en .42 con el promedio de califica- 
ciones del primer afio en la universidad. Es in- 
teresante que cl historial en educacidn media 
(p. ej., el rango o promedio de calificaciones) 
se desempefia mejor que la SAT en la predic- 
cidn de las calificaciones univcrsitarias (r=.48). 
Pero la combinacidn de la SAT y el historial en 
bachillerato resulta todavla mejor para la pre- 
diccidn; estas variables se correlacionan, en pro¬ 
medio, en .55 con el promedio de calificaciones 
del primer ano de universidad. Por supucsto, 
estos datos reflejan una restriccidn sustancial 
de los Ifmites: los estudiantes de bachillerato con 
bajas calificaciones en la SAT no asistcn a la 
universidad. Donlon (1984) estima que la co- 
rrclacidn real sin restriction de llmitcs (SAT + 
calificaciones del bachillerato) se cncontrarfa 
en las cercanfas de .65. 

Una cuestiOn de gran preocupaciOn es el 
cfecto del estudio y del entrenamiento especial 
sobre las calificaciones de la SAT. ^Sirve de 
algo recibir entrenamiento especial en vocabu- 
lario o matemdticas o leer las numerosas gufas 
de estudio que estdn disponibles en casi cual- 
quier librerfa? Messick y Jungeblut (1981)rc- 
visaron los estudios disponibles que utilizaban 
un formato de g.upo experimental contra gru- 
po control. Estos investigadores concluyeron 
que el entrenamiento eleva las calificaciones 
combinadas de las pruebas Verbal y de Mate¬ 
mdticas en aproximadamente 28 a 30 puntos, 
lo cual no represents un incremento sustancial 
en comparaci6n con la falta de entrenamiento/ 
preparation. No obstante, para los estudiantes 
con alto nivel de motivation que buscan en¬ 


trenamiento y reciben un programs estructu. 
rado, riguroso, los efcctos del entrenamiento 
son mucho mds grandcs, de 45 a 110 puntos en 
las puntuacioncs Verbal y de Matemdticas 
combinadas (Johnson, 1994). Una cuestiOn re- 
lacionada tiene que ver con la elevada propor- 
ci6n de estudiantes que contestan la SAT mds 
de una vcz. ^Las calificaciones tienden a cle- 
varse con la rcpetici6n de la prueba? En casos 
donde la repetici6n ocurre dentro de los siguicn- 
tes 5 a 8 mescs, el incremento promedio es dc 
cerca dc 12 puntos para cada una dc las califi¬ 
caciones Verbal y de Matemdticas (Donlon, 
1984). Esto refleja, en parte, la familiaridad con 
la prueba, pero un factor que muchos pasan poi 
alto es el aprendizaje activo que puede ocurrir 
en el (nterin. 


PRUEBA UNIVERSITARIA 
ESTADOUNIDENSE 

El programs ae evaluation de la American 
College Test , ACT (Prueba Universitaria Esta- 
dounidense), es un sistema reciente de examen 
e informe disenado para estudiantes que pro- 
tenden ingresar a la universidad. Ademds de las 
calificaciones tradicionales de la prueba, el pro¬ 
grams de evaluation de la ACT incluye un in- 
ventario de interescs con 90 reactivos (basado 
en la tipologia de Holland) y una secciOn sobre el 
perfil del estudiante (en la que el alumno puede 
listar las materias estudiadas, logros notables, 
expericncia laboral y servicios cornunitarios). 
Aquf no sc analizardn estas medidas complc- 
mentarias, excepto para senalar que son utiles 
para generar el Informe del perfil del estudian¬ 
te, que se envfa a la persona examinada y a las 
universidades listadas en la carpeta de registro. 

Iniciada en 1959, la ACT se bas6 en la ft- 
losofla de que las pruebas directas de las habi- 
lidades nccesarias para los cursos universitarios 
proporcionan la base mds eficaz para predecir 
el desempefio en la universidad. En tdrminos 
del numero de estudiantes que contestan la prue¬ 
ba, la ACT ocupa el segundo lugar despuds de 
la SAT como examen de admisiOn a la univer¬ 
sidad. Las cuatro pruebas de la ACT requieren 
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del conocimiento cn un drca tcmAtica, pero 
enfatizan la utilizacidn de ese conocimiento: 

• lngl«Ss (75 prcguntas. 45 minutos). Sc presen- 
tan al examinando varios fragmentos de pro- 
sa extrafdos de escritos publicados. Ciertas 
partes del texto se cncucntran subrayadas y 
numeradas, y se presentan posibles revisio- 
nes para las secciones senaladas; ademas exis- 
te una opcidn de "sin cambio". La persona 
debe elegir la mejor altemativa. 

• Matem&icas (60 preguntas, 60 minutos). Aquf 
$c le pide al estudiante evaluado que rcsuel- 
va los tipos de problemas matemaiicos que es 
probable que se presenten en los cursos bdsicos 
de matemdticas en la universidad. La prueba 
enfatiza los conceptos m&s que las fdrmulas 
y uliliza un formato de opcidn multiple. 

• Lectura (40 preguntas, 35 minutos). Esta 
subprueba esta disefiada para cvaluar cl nivel 
dc la persona examinada en cuanto a compren- 
sidn dc lectura; se presentan subpuntuaciones 
para las habilidades de lectura en ciencias so- 
ciales y artes/literatura. 

• Razonamicnto cn ciencias naturales (40 pre¬ 
guntas, 35 minutos). Esta prueba evalua la 
capacidad de lectura y comprensidn dc mate¬ 
rial de ciencias naturales. Las preguntas se 
extracn dc reprcscntaciones de datos, resu- 
menes de investigacidn y puntos de vista con- 
flictivos. 

Ademas de las calificaciones de drea que se 
sefialan antes, los resultados de la ACT tam- 
bien se presentan como una Puntuacidn mixta 
total, que es el promedio de las cuatro pruebas. 
La calificacidn de la ACT se muestra en una 
eseala de puntuacidn estdndar de 36 puntos. En 
1992, el promedio de la Puntuacidn mixta dc la 
ACT para los graduados de bachillerato era dc 
20.7, con una desviacidn estdndar de aproxi- 
madamente cinco puntos (Maxey, 1994). No 
obstante, como en la SAT, las calificaciones dc 
la ACT no son fijas para algiin ado en particular; 
mostraron la misma disminucidn en los dece- 
nios de 1960 y 1970 que se observd en la SAT. 

Los crfticos del programa ACT han sefia- 
lado el dnfasis en la comprensidn dc lectura que 
satura las cuatro pruebas. La intercorrelacidn 


promedio dc las pruebas se encucntra por lo 
comun alredcdor de .60. Estos datos sugieren 
que un factor general dc rcndimiento/capaci- 
dad domina las cuatro pruebas; por tanto, no 
deben sobreinterpretarse los resultados de cual- 
quicr prueba especffica. Por fortuna, es proba¬ 
ble que las personas encargadas dc la admisidn 
a la universidad le den mayor dnfasis a la Pun¬ 
tuacidn mixta, que es el promedio de las cuatro 
pruebas independientes. La ACT parece medir, 
en gran parte, lo mismo que la SAT; la correla- 
cidn enlre ambas se acerca a .90. Por tanto, no 
es de sorprender que la validcz predictiva de la 
Puntuacidn mixta de la ACT rivalice con la de 
la puntuacidn combinada de la SAT, con corre- 
lacioncs en las cercanfas de .40 y .50 entre la 
puntuacidn mixta de la ACT y el promedio dc 
calificaciones del primer ano de universidad. 
Las coeficientes de validez predictiva son casi 
iddnticos para estudiantes de todo tipo dc am- 
bientes y circunstancias, lo cual indica que las 
pruebas ACT son imparciales. 

Kifer(1985) nocuestiona la idoneidad tdc- 
nica de la ACT y de programas similares dc 
prueba, pero sf protesta contra el enormc poder 
simbdlico que han acumulado estos exfimenes. 
El dnfasis en las calificaciones de la prueba para 
las admisiones a la universidad no es una cues- 
tidn dtica, sino una preocupacidn social, moral 
y politics: 

Las admisiones selectivas Implican simplemen- 
(e que una institudbn no podrA o no querrA adml- 
tir a cualquier persona que ilene una soiicitud. La 
decision de a quiAn se admitirA y a qulbn no, de- 
berfa ser, en primer lugar, una cuestibn de aque- 
llo que la institucibn considers deseable y puede 
o no induir el uso de ecuaciones de predicclbn. 

Es tan justiflcable seieccionar con base en el ta- 
lento, interpretado de manera amplia, como lo 
es utilizar las calificaciones de una prueba. por 
altas que sean. Exlsten estudiantes talentosos 
en muchas Areas —lideres, organizadores, crea- 
doros, muslcos, atielas, ganadores de premios 
dentificos, aficionados a la bpera— que pueden 
tener calificaciones moderadas o bajas en la ACT, 
pero cuya presencia en una universidad la trans- 
formarfan. 

Es posible que el lector desee revisar el tema 
7B (Sesgo dc una prueba y otras controversias) 
para un mayor anAIisis sobre este punto. 
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■ PRUEBAS DE SELECCION 
DE POSGRADOS 


Los programas de posgrado y profesiona- 
les tambidn dependen, en gran medida, de las 
pruebas de aptitud para las decisiones de admi- 
si<5n, Por supuesio, se toman en consideracidn 
muchos otros factores cuando se selecciona a 
estudiantcs para entrenamiento avanzado, pero 
no se puede negar la funcidn central de los re- 
sultados de las pruebas de aptitud para las deci¬ 
siones de seleccidn. Por cjemplo, la figura 8-5 
presenta un sistema comun de importancia 
cuantitativa quc se utiliza en la evaluacidn de so- 
licitantes para el entrenamiento de posgrado en 
psicologfa. El lector ver& que la calificaci6n 
total en el Graduate Record Exam, GRE (Exa- 
men de Seleccidn para Posgrado), recibe la ma¬ 
yor importancia en el proceso de seleccidn. En 
las siguientes secciones se revisa cl GRE, asf 
como las pruebas de admisidn que se utilizan 
en las escuelas de medicina y leyes. 

EXAMEN DE SELECadN 
PARA POSGRADO 

El GRE es una prucba grupal de opcidn multiple 
quc se utiliza de manera amplia en los progra¬ 


mas de posgrado en muchas drcas como un 
componente en la seleccidn de candidates para 
entrenamiento avanzado; ofirece exdmenes ternS- 
ticos en muchos campos (p. ej., Biotogfa, Cien- 
cias Informdticas, Historia, Matem4ticas, 
Ciencias Politicas. Psicologfa), pero cl almade 
la evaluacidn sc encuentra en la prueba general 
que estfi disenada para medir las aptitudes ver- 
bales, cuantitativas y analfticas. La scccidn verba] 
(GRE-V) incluye reactivos verbales como ana- 
logfas, terminacidn de oraciones, antdnimos y 
comprensidn de lectura. La seccidn cuantitati¬ 
va (GRE-Q) consistc en problemas de Algebra, 
geometrfa, razonamiento y la interpretacidn de 
datos, graficas y diagramas. La seccidn analfti- 
ca (GRE-A) incluye problemas de razonamiento 
analftico y ldgico. Las tres calificacioncs del 
GRE se presentan como puntuaciones estfndar 
con una media aproxlmada de 500 y desvia- 
cidn estdndar de 100. De hecho, la calificacidn 
media puede diferir de un afio a otro, debido.a 
que todos los resultados de la prueba se vincu- 
lan con un grupo cstdndar de referencia de 
2 095 estudiantes de los dltimos ados de la uni- 
versidad evaluados en 1952 en las partes ver¬ 
bal y cuantitativa de la prueba. Los programas 
de posgrado tienden a prestar atencidn a la com- 
binacidn de calificaciones en las primeras dos 
partes (GRE-V + GRE-Q), donde las califica- 


Calificaciones GRE 

0 

6 

12 

18 

24 

30 

total GRE-V ♦ GRE-Q total: 


1 000 

1 100 

1 200 

1 300 

1 400 

Promedio general de caWicaciones (PGC) en pregrado 

0 

5 

10 

15 

20 

25 



3.0 

3.2 

34 

3.6 

3.8 

PGC an Psicologfa 

0 

1 

2 

3 

4 

5 



30 

3.2 

3.4 

36 

3.9 

AMecedentes en estadtstica/experlmentaies 

0 

1 

2 

3 

4 

5 

Aniecedentes en 







Biotogia/Oulmica 

0 

1 

2 

3 

4 

5 

Aniecedentes en 







MatemMcas/Ciencias inlormillicas 

0 

1 

2 

3 

4 

5 

Experiencia en investigation 

0 

1 

2 

3 

4 

5 

Habllldades interpersona les 







positivas 

0 

2 

4 

S 

8 

10 

Diver sidad Otnicadingulstica/ 







cultural 

0 

2 

4 

6 

8 

10 






Total mOximo: 100 


Flgura 8-5. Esquema de pondoraclones representatives utilizado por los Comitds de AdmiskJn at Programa de 
Posgrado en Psicologfa. 






Pruebas grupales de aptitud y de rendimlento • 343 


cioncs combinadas que supcren a 1 000 sc con- 
sidernri'an supcriores al promedio. 

La confiabilidad dc! GRE cs fucrtc, con 
co eficien(es de confiabilidad de consistencia 
interna que por lo comun se encuentran alrcde- 
dor de .90 para los Ires componentes. Por lo 
general, la validez del GRE sc ha examinado 
en relacidn con la capacidad de la prueba para 
predecir el dcsempefio en la escucla de posgra¬ 
do. El desempeno se ha medido principalmente 
de acucrdo con cl promedio dc calificacioncs, 
aunque tambien se han utilizado las califica- 
ciones de los acaddmicos sobre la aptitud del 
estudiante. Por cjemplo, con base en una revi¬ 
sion metaanalftica de 22 estudios con un total de 
5 |86estudiantcs, Morrison y Morrison (1995) 
concluyeron que cl GRE-V se correlacionaba 
en .28 y el GRE-Q en .22 con el promedio de 
calificaciones en posgrado. Asf, en promedio, 
las calificacioncs en el GRE cxplicaban s6lo 
6.3% dc la varianza cn el desempeno acaddmi- 
co a nivel de posgrado. En un estudio reciente con 
170 estudiantes de posgrado en psicologfa de 
In Universidad de Yale, Sternberg y Williams 
(1997) tambidn encontraron correlaciones mf- 
nimas entre las puntuaciones del GRE y las 
calificaciones del posgrado. Cuando se corrcla- 
cionaron las puntuaciones en el GRE y las cali¬ 
ficaciones de los acaddmicos en cinco variables 
(capacidadcs analfticas, crcativas, pr£cticas, dc 
investigacidn y de ensefianza), las correlacio¬ 
nes fueron incluso menores, donde la mayor 
parte oscilaba alrededor de cero. La unica 
excepcidn fue la puntuacidn en el GRE-V, que 
sc correlacion6 poco con casi todas las califi¬ 
caciones de los profesores. No obstante, csta co- 
rrelacidn se observd sdlo cn el caso de los 
varones (cn cl orden de r = .3), jmientras para 
las mujeres fue exactamentc de cero en todos los 
casos! Con base en dstos y otros estudios si- 
milarcs, el conscnso pareccrfa scr que la de- 
pendencia excesiva en el GRE para la scleccidn 
a la escuela de posgrado podrfa pasar por alto 
una reserva de talentos con prometedores cs- 
ludiantes de posgrado. 

A pesar de ello, otros investigadorcs son 
mis optimistas en su valoracidn del GRE, al se¬ 
rial ar que la correlacidn entre las puntuaciones 


de la prueba y las calificaciones del posgrado 
no es un buen mdice de validez debido al pro¬ 
blems de la restricci6n del rango (Kuncell, 
Campbell y Ones, 1998). Especfficamcnte, los 
solicitantes con bajas calificaciones en el GRE 
tienen mcnos probabilidades de que se les acep- 
te de inicio para el entrenamiento en posgrado 
y. por tanto, exisle relativamente poca informa- 
ci6n disponible con respecto a si las bajas cali¬ 
ficacioncs predicen un desempeno acaddmico 
deficiente. Dicho de manera sencilla, la corre- 
lacidn dc las calificaciones del GRE con el 
desempeno acaddmico en posgrado se basa 
principalmente en personas con calificacio¬ 
nes en los nivcles medio a alto en esta prueba, 
cs deeir, con totales GRE-V + GRE-Q de 1 000 
o mils. Como tal, la correlacidn se atenuarfa pre- 
cisamente debido a que no se incluye cn la 
muestra a aquellos que tienen bajas calificacio¬ 
nes en el GRE. Otro problems con la valida- 
cidn dc esta prueba contra las calificacioncs en 
la escuela de posgrado es la falta de confiabili¬ 
dad del criterio (calificaciones). Con base en la 
expectativa de que los estudiantes de posgrado 
tcndrdn un desempefio a nivelcs elevados, al- 
gunos profesores pueden dar dieces indiscrimi- 
nados, de modoque las calificaciones no reflejan 
diferencias reales en las aptitudes de los estu¬ 
diantes. Esto rcducirfa la correlacidn entre el 
medio de prediccidn (puntuaciones en el GRE) 
y el criterio (calificaciones del posgrado). Cuan¬ 
do se aclaran estos factores, muchos investi¬ 
gadorcs encuentran razones para considerar que 
cl GRE aun cs una herramienta v&lida para la 
selcccidn en posgrado (Melchert, 1998; Ruscio, 
1998). 

PRUEBA DE ADMISI6N A LA FACUUAD 
DE MEDICINA 

La Medical College Admission Test, MCAT 
(Prueba de Admisidn a la Facultad de Medici- 
na) es un requisito para los solicitantes de casi 
todas las escuelas de medicina en EUA. La prue¬ 
ba se disehd para evaluar el rendimiento en las 
habilidades y conceptos bflsicos que son requi¬ 
sito previo para la terminacidn exitosa de los 
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estudios de medicina. Tiene tres secciones de 
opcidn multiple (Razonamicnto Verbal, Cien- 
cias Ffsicas y Ciencias Bioldgicas) y una sec- 
ci6n de ensayo (Muestra de Redaccidn). La 
seccidn de Razonamiento Verbal se disend para 
evaluar la capacidad para comprender y aplicar 
la informacidn y argumentos presentados en 
forma cscrita. La prueba consiste, especffica- 
mente, en varios pasajes de aproximadamente 
S00 a 600 palabras cada uno, tornados de tra- 
bajos sobre humunidades, ciencias socialcs y 
ciencias naturales. A cada uno le siguen varias 
preguntas basadas en la informacidn que se in- 
cluye en el texto. La seccidn de Ciencias Ffsi¬ 
cas estd disenada para evaluar el razonamiento 
en qufmica y flsica generales. Ciencias Biol6- 
gicas se diseri6 para valorar el razonamiento en 
biologfa y qufmica orgdnica. Estas secciones 
de ciencias ffsicas y biol6gicas contienen de 10 
a 11 series de problemas dcscritos en ccrca de 
250 palabras cada uno, a los que les siguen 
varias preguntas. La prueba de Muestra de Re- 
daccidn consiste en das ensayos de 30 minutos. 
Esta prueba se disefid para evaluar las habili- 
dades bdsicas de redaccidn como desarrollo de 
una idea central, sfntesis de conceptos e ideas, 
redactar de manera Idgica y seguimiento de las 
prdcticas aceptadas en cuanto a gramdtica, sin- 
taxis y puntuacidn. 

Cada una de las calificacioncs de la MCAT 
se presenta en una escala de 1 a 15 (medias de 
aproximadamente 8.0 y desviacidn estdndar 
de cerca de 2.5). La confiabilidad de la prueba 
es menor que la de otras pruebas de aptitud que 
se utilizan para seleccidn, con coeficientes de 
consistencia interna y por mitades que princi- 
palmente sc encuentran en la parte baja del ran- 
go de .80 (Gregory, 1994a). Las calificaciones 
de la MCAT predicen de manera minima el 
dxito en la cscuela de medicina, pero de nuevo 
esto se debe a la participacidn del enigma de la 
restriccidn del rango (que se analizd anterior- 
mente en rclacidn con el GRE). En particular, 
en pocas ocasiones se admite a los individuos 
examinados que tienen bajas calificaciones en la 
MCAT y que presumiblementc confirmarfan 
la validez de la prueba al tener un desempeno 


deficiente en la escucla de medicina, lo cual re¬ 
duce la validez aparente de la prueba. 

PRUEBA DE ADMISI6N A LA FACULTAD 
DELEYES 

La Law School Admission Test, LSAT (Prueba 
de Admisidn a la Facultad de Leyes), es una 
prueba estandarizada que se aplica en medio 
dfa y que es requisito para los solicitantes de 
casi todas las cscuelas de leyes en EUA. La 
prueba se disefid para medir las habilidades que 
se consideran esenciales para tener 6xito en la 
escucla de leyes, incluyendo lectura y compren- 
sirtn de material complcjo, organization y ma- 
nejo de information y capacidad para razonar 
de manera crftica y obtener inferencias correc- 
tas. La LSAT consta de preguntas de opci6n 
multiple en cuatro areas: comprensiOn de lec¬ 
tura, razonamiento analftico y dos secciones de 
razonamiento Idgico. Se utiliza una sccciOn 
adicional para someter nuevos reactivos a 
una prueba preliminar y realizar una adecua- 
ci6n previa de nuevas formas de prueba, pero 
esta secciOn no contribuye a la calificaciOn de 
la LSAT. La escala de calificacioncs para la 
LSAT se extiende desde un nivel bajo de 120 
hasta uno alto de 180. Ademds de las partes 
objetivas, sc aplica una muestra de redaccidn 
de 30 minutos al Final de la ptueba. La secciOn no 
sc califica, pero se envfan copias de esta mues¬ 
tra a todas las escuelas de leyes a las que hizo 
solicitud la persona evaluada. 

La LSAT tiene confiabilidad aceptaoie icoe- 
ficientes de consistencia interna a la mitad del 
rango de .90) y se le considcra como un medio 
de predicciOn moderadamente vdlido de las ca¬ 
lificaciones en la escuela de leyes. No obstan¬ 
te, en un fascinante estudio, las calificaciones de 
la LSAT se corrclacionaron en mayor medi- 
da con los resultados del examen de la barra de 
abogados estatal que con las calificaciones de la 
escuela de leyes (Melton, 1985). Esto habla bien 
de la validez de la prueba, en la medida en que 
vincula las calificaciones de esta prueba con 
un criterio importante y de la vida real. 
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j gRESUMEN _ 

1. Las pruebas de aptitud y capacidad difieren 
en enfoquc y utilizacidn. En general, la ca¬ 
pacidad cs un concepto amplio, mientras la 
aptitud se rcfiere, por lo comun, a segmcn- 
tos homogineos de capacidad. Tambidn, las 
pruebas de capacidad intentan estimar el 
funcionamiento actual, mientras las de ap- 
titud suelen emplcarsc para ayudar a pre- 
decir el desempefio futuro. 

2. Las pruebas de aptitud deben sus orfgenes 
al anilisis factorial, una familia de procedi- 
mientos empleados para resumir las rela- 
ciones entre variables que se correlacionan 
de mancras sumamentc complejas. Por 
ejcmplo, el anilisis factorial podrfa ayudar 
a un investigador a dcscubrir quc una bate- 
rfa de 24 pruebas de capacidad representa 
sdlocuatro variables subyacentes, llamadas 
factores. 

3. El punto inicial de todo analisis factorial es 
la matriz de corrclacidn, un cuadro com- 
pleto de intercorrelaciones entre todas las 
variables; estas ultimas pueden incluir re- 
sultados en cualquier dimension mis o me¬ 
nus continua; por ejemplo, calificaciones de 
la prueba, clase social y calificaciones con- 
ductuales. 

4. La matriz factorial consisle en un cuadro 
de cargas factoriales que muestran la im¬ 
portance de cada variable en cada factor. 
Un factor es una suma lineal ponderada de 
las variables. La carga factorial para cada 
variable es un coeficiente de correlacidn en¬ 
tre el factor y esa variable. 

5. Los factores pueden trazarse como ejes 
geomdtricos de referenda, y las cargas para 
cada variable en cada factor pueden repre- 
sentarsc dcntro de ese espacio; esto permite 
que el investigador visualice la localizacidn 
de cada variable en los 2 o 3 factores mis 
importantes. 

6. Dado que la posicidn de los ejes de referen¬ 
da es arbitraria, el investigador esti en liber- 
tad de girar los ejes de modo que produzcan 


la correspondcncia mis sensata con las car¬ 
gas factoriales para las variables. Existen 
diversos mdtodos de rotacidn (p. ej., rota- 
ci6n hacia varicdad posiliva y rotacidn ha- 
cia estructura simple). 

7. El nombre quc se da a los factores requiere 
juicio e infcrencia. En particular, el investi¬ 
gador debe hacer el intento de determinar 
los procesos y capacidades comunes que 
comparten las pruebas o variables con fuer- 
tcs cargas en un factor. Tambiin, las prue¬ 
bas o variables con bajas cargas pueden 
ayudar a afinar la definicidn y denomina- 
ci6n de iste. 

8. Para que pueda surgir un tipo particular de 
factor a partir de un anilisis, algunas de las 
pruebas y medidas deben contener de ini- 
cio ese factor. Se preficren muestras gran- 
des, mayores a 200 personas. Es importante 
la elcccidn de estrategias para la rotacidn: 
los ejes ortogonales suponen que los facto¬ 
res no ticncn corrclacidn, mientras los ejes 
oblicuos suponen que los factores estin 
correlacionados. 

9. El (DAT) que sc utiliza para la orientacidn 
educativa y vocacional en los affos de edu- 
cacidn media, consta de ocho piuebas in- 
depcndicntes. Una prcocupacidn acerca de 
esta respetada baterfa es la falta de validez 
discriminativa entre las ocho pruebas. 

10. La GATB es tfpica de las baterfas de aptitu¬ 
des multiples basadas en el anilisis factorial. 
Consta de ocho pruebas de lipiz y papel, y 
cuatro medidas con aparatos derivadas de 
un anilisis factorial de 59 pruebas. La ba¬ 
terfa produce nueve puntuaciones factoria¬ 
les utiles en la prediccidn del desempefio 
en el trabajo. 

11. La ASVAB, quc sc utiliza en las fuerzas ar¬ 
madas para seleccionar y asignar a los re- 
clutas, es probablemente la prueba de lipiz 
y papel de uso mis amplio quc sc tenga en 
existencia. De la prueba se obtienen pun¬ 
tuaciones mixtas, cada una basada en las 
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calificaciones de 2 a 4 subpruebas. Una li- 
mitacidn de la ASVAB es que las punlua- 
ciones mixtas tienen altas correlaciones 
cntrc sf. 

12. La prediccidn del dcsempeno acaddmico se 
facilita con pruebas como las SAT, y el pro- 
grama de evaluacidn de la ACT. 

13. La SAT produce calificaciones independen¬ 
ces en las dreas Verbal y de Matemdticas cn 
referenda a la media de 500 (DE de 100) 
obtenida en 1941. La ACT produce cuatro 
calificaciones (inglds, matemdticas, lectu¬ 
re y razonamiento en ciencias naturales) que 
se presentan en una escala de puntuacidn 
estdndar de 36 puntos (media de aproxima- 
damcnlc 20.7 y DE de 5). 

14. El GRE, que se utiliza pare admisidn a mu- 
chos programas de posgrado, consiste cn 
ties pruebas generales (Verbal, Cuantitativa 
y Analitica), asf como de pruebas temdti- 


cas en dreas especfficas (p. ej., Biologfa, 
Ciencias Informdticas y Psicologfa). Las 
normas de cada examen se establecieron 
con una media aproximada de 500 y DE de 
100 . 

15. La MCAT es requisito para los solicitantes 
de casi tod as las escuelas de niedicina en EU A. 
Tiene ties secciones de opcidn multiple (Ra- 
zonamiento Verbal, Ciencias Ffsicas y Cien¬ 
cias Bioldgicas) y una seccidn de ensayo 
(Muestra de Redacci6n), todas disenadas 
para evaluar las habilidades bdsicas ncce- 
sarias para la escuela de medicina. 

16. La LSAT es una prueba cslandarizada que 
se aplica en medio dfa y que es requisito 
para los solicitantes de casi todas las escuc- 
las de leyes en EUA. Consiste en preguntas 
de opcidn multiple cn cuatro dreas: Com- 
prensidn de Lecture, Razonamienlo Analf- 
tico y dos secciones de Razonamiento 
Ldgico. 


pTERMINOS Y CONaPTOS CLAVE 


Andlisis factorial 

p. 322 

Rotacidn hacia variedad positiva 

p. 326 

Factores 

p. 322 

Rotacidn hacia cslructura simple 

p. 326 

Matriz de correlacidn 

p. 323 

Ejes ortogonales 

p. 330 

Matriz factorial 

p. 325 

Ejes oblicuos 

p. 330 




Tema 8B 

Pruebas grupales de rendimiento 


Conceptos esenciales en pruebas de rendimiento 

Pruebas de rendimiento educativo 

Pruebas de rendimiento con propbsitos especfficos 

Falseamiento: el lado oscuro de las pruebas de rendimiento 

Resumen 

Tdminos y conceptos clave 



En cste tema se continue con el anAlisis 
de las pruebas grupales al cstudiar su empleo den- 
tro de los sistemas educativos. Desde los anos 
de la educacidn primaria, los distritos escola- 
res utilizan pruebas grupales de rendimiento 
para seguir el progreso de los estudiantes indi¬ 
viduates y estimar el dxito de los programas edu- 
cativos. La difundida prdctica de estas pruebas 
dentro de las escuelas estadounidenses es, en 
gran medida, un asunto positivo debido a que 
proporciona una base objetiva para la evalua¬ 
tion. No obstante, en ocasioncs tambidn tiene 
un lado oscuro, en la medida en que la prueba 
puede volverse en contra de las expectativas. 
El impacto negativo puede encontrarse en ties 


categorfas generates. Primera, los maestros pue- 
den ensenar para pasar la prueba, en vez de 
tratar de impartir un conocimiento genuino. 
Segunda, en la busqueda por obtener altas cali- 
ficacioncs para sus sistemas cscolares, los ad- 
ministradores pueden fomentar un ambiente que 
aliente las pruebas liberales, no estandarizadas. 
Pcor adn, el personal de la escuela puede parti- 
cipar en un fraude expllcito como “corrcgir" 
las hojas de respuesta. La tcrcera consecuencia 
es que los examinandos individuals enconlra- 
ran maneras ingeniosas de faJsear los resul- 
tados en pruebas con normas nacionales. Al 
final de este tema se revisan algunas de estas 
tendencias alarmantes. 
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B conceptos esenciales en 

PRUEBAS DE REND1MIENTO 


Las pruebas de rendimiento, conocidas cumo 
pruebas de logro cn el Reino Unido, son las de 
uso m&s amplio entre todos los tipos de prueba. 
Aunque no exisien cifras precisas en cuanto a 
utilizacidn, en EUA casi cualquier nino en edad 
escolar se enfrenta anual o bianualmente a una 
prueba grupal estandarizada de rendimienio. Un 
estimado es que las cscuclas publicas aplican 
un promedio de dos y media pruebas por eslu- 
dianlc cada ano (Medina y Neill, 1990). Sin 
duda, el numero de pruebas de rendimienio que 
se aplican sobrepasa lodas las otras formas de 
evaluacidn psicoldgica y educativa. 

Las pruebas de rendimienio estdn disena- 
das para medir la obtencidn de las habilidadcs 
que se ensenan dentro de programas cscola- 
res o de entrenamiento. Estas pruebas pueden 
deflnirse de manera bastante estrecha. como 
en cl caso de una prueba de habilidadcs de ca- 
lificacidn, o concebirse de modo mis amplio, 
como cn cl caso de una prueba de comprcnsidn 
de lectura. Aunque las pruebas de rendimienio 
difieren en su especificidad, todas salisfaccn 
una funcidn rclacionada: medir cl nivel actual 
de habilidad cn un Area bien definida. 

Como se les cataloga en la serie del Men¬ 
ial Measurements Yearbook (Conoley e Impara, 
1995;Conoleyy Kramer, 1989, 1992; Milchcll, 
1985), se han publicado literalmente cientos de 
estas pruebas, lo que diflculta revisar el amplio 
panorama dc estos instrumentos; en vez de ello, 
se revisardn las pruebas mis representativas y 
enfocandosc en los problemas que surgen dc- 
bido a su empleo. Se comicnza con un com- 
pendio acerca de los conceptos esenciales en el 
examen del rendimienio. 


PRUEBAS GRUPALES E INDIVIDUALS 
DE RENDIMIENTO 

Se ha establecido una distincidn fundamental 
entre las pruebas grupales e individuates de ren¬ 
dimienio. Las primeras se utilizan principalmen- 
te en el salbn de clase, mientras las segundas se 


usan en entomos clfnicos y cducaiivos dondc 
la evaluacidn es personal. Las pruebas gru. 
pales dc rendimienio podrfan llamarse lam- 
bidn pruebas de aprovechamiento cducativo, 
ya que es comun que estos instrumentos se apli- 
quen a todo un sistema escolar a instancias de 
los superintendentes escolares u otros adminis- 
tradorcs dentro de una coordinacidn estatal. Por 
supucsto, las pruebas grupales se aplican de 
manera simultinca a docenas o cientos de estu- 
diantes, con todas las ventajas y desventajas que 
este enfoque conlleva (tema 2B. Proceso de 
aplicacidn). 

Las pruebas individuales de rendlmien- 
to representan una funcidn esencial en cl diag- 
ndstico de la discapacidad para el aprendizaje 
(DA), pues no s61o proporcionan documcnta- 
cion para las alteraciones en el desempeho cn 
Sreas academicas importantes como la lectura, 
escritura y c&lculo. sino tambidn algunas dc ellas 
pueden ayudar a idcntificar las deficiencias par- 
ticulares en cuanto a habilidades que subyacen 
a las discapacidades para el aprendizaje. Como 
se analiza mds adelante, las pruebas individua¬ 
les dc rendimienio se utilizan junto con otros 
instrumentos, en especial pruebas de inteligen- 
cia, como se analiza en el tema 10A Evalua- 
ci6n escolar. 

PRUEBAS REFERIDAS A NORMAS 
Y A CRI7ERIO 

Adcmds dc la dicotomfa fundamental que divi¬ 
de a las pruebas de rendimiento en grupales e 
individuales, otra importante distincidn es aque- 
11 a entre las pruebas de rendimiento referidas a 
normas y a criterio. El lector recordard del tema 
2A (Naturaleza y usos de las pruebas psicold- 
gicas) que las pruebas referidas a normas per- 
miten la interpretacidn en relacidn con una 
gran muestra dc cstandarizacidn. Estas praebas 
facilitan el informe de las calificaciones como 
rangos percentiles, puntuaciones estdndar y si- 
milares. En contraste, las pruebas referidas a 
criterio permiten la interpretacidn con relacidn 
al contenido especffico que domina cl indivi- 
duo examinado. Por ejemplo, una prueba refe- 
rida a criterio podrfa determinar que una persona 
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sabe ia ortograffa correcta de 94 de los 100 
reactivos de una lista espcciTica de palabras 
esencialcs. Por supuesto, ambos cnfoques no 
son necesariamente incompatibles. De hecho, 
la mayor parte de las principales pruebas dc 
rendimicnto proporcionan interpretaciones tan- 
10 referidas a normas como a criterio. 

pruebas de capacidad, aptitud 

Y RENDIMIENTO 

La distinction entre pruebas de capacidad, apti¬ 
tud y rendimienio mcrece una breve revisidn 
dentro dc este contcxto. Las primcras toman una 
muestra de un amplio conjunto de habilidadcs 
a fin de estimar el nivel intelectual general. En 
contraste. las de aptitud suelen medir segmen¬ 
ts homogdneos de capacidad y con frecuencia 
se les utiliza para predecir el dcsempefio futu- 
ro. Las excepciones en este caso incluycn las 
baterfas dc prueba de aptitudes multiples, que 
toman una muestra amplia de capacidades; es- 
tos instmmcntos son muy similares a las prue¬ 
bas de capacidad. Por dltimo, como se seiiald 
antes, las pruebas de rendimicnto miden la ob- 
tcncidn dc habilidades en el momento presen¬ 
te, en particular con relacidn a los programas 
escolares y dc cntrenamiento. 

En el mundo real, la distincidn entre estos 
tres tipos de pruebas es, a mcnudo, bastante 
confusa (Gregory, 1994a). Durante algun tiem- 
po se ha sabido que la corrclacidn entre las prue¬ 
bas de rendimiento y de capacidad puede ser 
casi tan elevada como la que cxiste entre dos prue¬ 
bas de capacidad. En muchos casus, ambus pruebas 
tocan factores cognitivos subyacentes muy si¬ 
milares. No obstante, las suposiciones que se 
encuentran como base para estas dos formas de 
prueba dificren mucho. En general, las pruebas 
dc rendimicnto cstdn disenadas para medir los 
efectos dc experiences educati vas relati vamen- 
te estandarizadas, mientras que, por lo comun, las 
pruebas dc capacidad hacen pocas suposiciones 
acerca de las experiences especfftcas de apren- 
dizaje que hayan ocurrido con anterioridad. 

Las aplicaciones de las pruebas dc aptitud 
y de rendimiento tambidn difieren en gran me- 


dida. Las primeras estdn disenadas primordial- 
mente para predecir el desempeno futuro en 
programas escolares o de entrenamiento. Por 
cjcmplo, podrfa utilizarsc una prueba dc apti¬ 
tud escolar para predecir el desempeno acadd- 
mico futuro en la universidad o emplearse una 
prueba de aptitud para trabajos de oficina, a fin 
dc pronosticar el desempeno futuro en un puesto 
secretarial. En contraste, las pruebas dc rendi¬ 
miento se usan para estimar el nivel actual de 
logro de un estudiantc en una materia espeeffi- 
ca. En otras palabras, las pruebas de aptitud 
estAn orientadas al futuro, mientras las de rcn- 
dimiento se orientan al presente. La evaluacidn 
del nivel actual de habilidad a travds de prue¬ 
bas dc rendimiento puede satisfacer varios pro- 
pdsitos, como sc express a continuacidn. 

FUNdONES DE LAS PRUEBAS 
DE RENDIMIENTO 

Estas pruebas tienen diversos usos potcnciaies. 
Las aplicaciones prActicas de las pruebas indi¬ 
viduates y grupales de rendimiento incluyen las 
siguientes: 

• Identificar a nifios y adultos con deficiencias 
especfficas en cuanto a rendimiento y que 
podrian necesitar de una evaluacidn mis minu- 
ciosa de discapacidades para el aprendizaje. 

• Ayudar a los padres a reconoccr las aptitudes 
y debilidades acaddmicas de sus hijos y, por 
tanto, fomentar los esfuerzos individuates de 
regularizacidn en el hogar. 

• Identificar las deficiencias en rendimiento a 
nivel de la clase y de la escuela como una 
base para redirigir los esfuerzos educativos. 

• Valorar el dxito de los programas educativos 
al medir el logro subsecuentc de habilidadcs 
de parte de los alumnos. 

• Agrupar a los estudiantes de acuerdo con el 
nivel similar de habilidad en Areas academi- 
cas especfficas. 

• Identificar el nivel de instruccidn apropiado 
para estudiantes individuates. 

Asf, las pruebas de rendimiento satisfacen 
metas institucionales como el registro de los 
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niveles de rcndimiento a nivel escolar, pero 
lambidn reprcscntan un importantc papel cn la 
evaluacidn de las dificultadcs individualcs de 
aprendizaje. Como se senal6 antes, se utilizan 
diferentes tipos de pruebas de rcndimiento para 
lograr cstas dos aplicaciones fundamentalcs 
(institucionales e individuales). Las metas insti- 
tucionales se logran mejor a travds de las baterias 
de pruebas grupales de rcndimiento, mientras 
la evaluacidn individual se realiza mejor con 
pruebas individualcs de rcndimiento (aunque 
las primeras tambidn pueden representar un 
papel en estc contexto). En este tema se centra 
la atencidn cn las pruebas grupales de rcndi¬ 
miento educativo. 


H PRUEBAS DE RENDIMIENTO 
EDUCATIVO 


Casi todos los sistemas escolares en EUA em- 
plean cuando menos una prueba de rcndimiento 
educativo, de modo que no es de sorprender 
que los editores de pruebas hayan respondido a 
esta ncccsidad gcncralizada al dcsarrollar una 
coleccidn de instrumentos excelentes. En la si- 
guiente seccion se describcn varias de las prue¬ 
bas cstandarizadas de rendimiento para grupos 
que mis se utilizan. Las pruebas a dcscribit 
comparten varias caracterfsticas. 

Primero, cstos instrumentos son baterias mul- 
tinivcl que contiencn subpruebas comparables 
para alumnos en los diferentes grados de escue- 
la pnmaria, secundaria o ambas. Algunas de las 
baterias abarcan desde el jardfn de ninos (K) basta 
bachillcrato, mientras otras estin disefiadas solo 
paia los niveles de escucla primaria (K hasta 
octavo) o de bachillcrato (9 a 12). En una bate- 
ria multinivcl, los protocolos de prueba contie- 
nen sccciones superpuestas y los estudiantes 
en los diferentes niveles, segun el grado csco- 
lar, inician y terminan con los materialcs de 
prueba cn la posicidn apropiada para su grado. 

Un segundo aspecto conuin en muchas de 
las baterias de pruebas educativas, cs la normati- 
zacitin concurrcntc con una prueba de capaci- 
dad. Por ejemplo, las normas de la bateria de 


rendimiento conocida como Pruebas secuen- 
ciales de progreso educativo Sequential Test 
of Educational Progress STEP-II (Pruebas 
Secuenciaies de Progreso Educativo), se obtu- 
vieron de mancra concurrcntc con las normas 
de la bateria de capacidad conocida como 
School and College Ability Test, SCAT-III 
(Prueba de Capacidad Escolar y Uni versitaria). 
Las pruebas cuyas normas se establecen de 
modo concurrcntc comparten la misma mues- 
tra de estandarizacidn. Como resultado, el de- 
sempeno promedio en una prueba puede 
compararse de manera dirccta con el obtenido 
cn la olra. Las normas concurrentes son utiles 
debido a que permiten que padres, maestros y 
orientadores hagan comparaciones precisas, 
directas y significativas entre rendimiento y 
capacidad. Despuds de todo, las implicaciones 
de una califtcacidn de rendimiento se moderan 
con base en el conocimiento de cuil es la capaci¬ 
dad del estudianle. Aqudl con altas caliiicaciones 
en capacidad, pero bajas en rcndimiento, po- 
drfa scr buen candidato para la intervencidn edu¬ 
cati va, incluyendo una evaluacidn mis detallada 
de una posible discapacidad para el aprendizaje 
(como se analiza en el tema I0A, Evaluacirtn 
escolar). En contrastc, un estudiante con bajas 
calificaciones en capacidad y en rendimiento 
podria estar trabajando a todo su potcncial; cn 
estc caso es posible que las intervenciones es- 
pecialcs no se justiiiquen. 

La tercera caracteristica comun en las prue¬ 
bas grupales de rcndimiento es que miden ha- 
bilidades educativas similares. Las pruebas de 
rendimiento educativo tienden a enfatizar las 
siguientes areas de habilidad: 

• Lcctura, incluyendo comprensidn y vocabu- 
lario. 

• Lenguaje escrito, incluyendo ortografi'a, pun- 
tuacidn y uso de letras mayusculas. 

• Matcmiticas, incluyendo cilculo y aplicaciones. 

Ademis. las prueoas para los niveles de prima¬ 
ria evaluan con frecucncia habilidades auditi- 
vas, incluyendo comprensidn oral. Algunas 
baterias de prueba tambidn evaluan conocimien¬ 
to de conceptos basicos cn ciencias naturalcs, 
cicncias socialcs y humanidades. 
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Por ultimo, las pruebas de rendimiento cdu- 
cativo que sc analizan aquf poseen, en general, 
caractcrfsticas psicomitricas cxcelentes. Los 
contenidos de la prueba son pertincntes y apro- 
piados; es dccir, las instrumentos muestran bue- 
na validez de contcnido. Las subcscalas poseen 
excclcnte confiabilidad interna y de formas al- 
tcmas. Las muestras de estandarizacidn son 
grandes y representativas invariablementc, y las 
pruebas no muestran sesgo abierto de gdnero o 
racial. I-a calidad psicomitrica de las pruebas de 
rendimiento educati vo de uso mis comun es tfpi- 
camente respetable, por no decircxlraordinaria. 

A continuacidn se examinan van as pruebas 
de rendimiento educati vo de amplio uso. El lec¬ 
tor descubriri que un anilisis detallado dc las 
propicdades psicometricas —confiabilidad, 
validez, normas y similares— se encuentra s61o 
en el primer instrumento revisado, las Iowa 
Tests of Basic Skills, ITBS (Pruebas Iowa de 
Habilidades Bisicas). En general, la calidad 
psicomdtrica de las otras pmebas es igualmente 
loable, de modo que en estas batcrfas dc prueba 
nos cnfocamos en sus funciones, aplicaciones. 
caracteristicas especiales y en una o dos defi- 
ciencias ocasionales. Los lectores que dcsecn mds 
informacidn sobre estos instrumentos deben 
consultar las revisiones en el Mental Measurements 
Yearbook (Conoley e Impara, 1995; Connley y 
Kramer, 1989, 1992; Mitchell. 1985V 


PRUEBAS IOWA DE HABIUDADES 
bAsicas 

Publicadas originalmente en 1935, las Iowa Tests 
of Basic Skills, ITBS (Pruebas Iowa de Habili¬ 
dades Bisicas), tuvicron su revisidn y 
reestandarizacidn mis rccientc en 1992. Las 
ITBS constituyen una baterfa multinivcl dc 
pmebas dc rendimiento que abarcan los grados 
K-9. Una prueba complcmcntaria, los Tests of 
Achievement and Proficiency, TAP (Pruebas 
Vocacional de Rendimiento), cubre los niveles 
de bachillerato. A fin de hacer mis expeditas 
las comparaciones directas y precisas entre ren¬ 
dimiento y capacidad, las normas de la ITBS y 
de !a TAP sc obtuvieron al mismo tiempo que 


las de la Cognitive Abilities Test, CogAT, (Prueba 
dc Capacidades Cognitivas), un respetado gru- 
po de pmebas de capacidad intelectual general. 

La ITBS sc encuentra disponible en varios 
niveles que corrcsponden aproximadamente a 
las edades de los posibles individuos a evaluar: 
niveles 5 y 6 (grados K-l), niveles 7 a 9 (gra¬ 
dos I a 3) y niveles 9 a 14 (grados 3 a 9). Las 
subpmebas bisicas para los niveles dc mayor 
edad miden vocabulario, lectura, lenguaje. ma- 
temiticas, ciencias sociales, ciencias naturales 
y fuentes de informaci6n. 

Dcsdc la primera edicidn, la ITBS se ha 
guiado por una filosoffa prictica de la medi- 
cion en educacidn. El manual express cl pro- 
pdsito del metodo de prueba como sigue: 

0 propdsito de la medfcibn conslsle en propor- 
cionar Inlormacibn que pueda emploarse para 
me|orar la ensefianza. La medicibti tieoo valor en 
la medida que db por resuHado mejores dedsbnes 
que afecten de manera directa a los alumnos. 

Para lograr esta meta, la ITBS incorpora un 
anilisis de habilidades referidas a criterio a fin 
de complementar el conjunto habitual dc cali- 
ficaciones referidas a normas. Por ejemplo, una 
caracterfstica disponible de parte del servicio 
dc calificacidn del editor es la informacidn a 
nivel del rcactivo. £sta indica ircas tematicas, 
reactivos que muestrean el tema y respuesta 
corrects o incorrecta para cada uno. Por tanto, 
los maestros ticnen acceso a un ciimulo de in- 
formacidn diagndstica-cducaliva para cada es- 
tudiante. Es muy diffcil cuantificar si esta 
informaci6n se traduce en una mejor ensenanza, 
como to desean sus autores. Como seiiala Linn 
(1989), “debemos dependcren gran medida dc 
la Idgica, las andedotas y las opiniones cuando 
se trata de responder a tales cuestiones”. 

Las propiedadcs tbcnicas de la ITBS estiin 
mis alii de dudas. Los cocficicntcs dc confiabi¬ 
lidad de consistencia interna y de formas equi¬ 
valences se encuentran en su mayor parte en la 
mitad del rango de .80 y a principios del de .90. 
Los coeficientes de estabilidad para un intcrvalo 
de un aho se encuentran casi todos en el rango 
entre .70 y .90. La prueba esti libre de sesgo 
explfcito de ginero y racial, como lo determinan 
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la evaluacidn del contenido y los estudios sobrc 
sesgo dc reactivos. La muestra de estanda- 
rizacidn dc la ultima cdicidn incluyd a 270 000 
estudiantcs estralificados aproximudamcnte 
segun el tipo de escuela (publica/privada/pa- 
rroquial), ciudades grandes y pcquefias, regio- 
nes geogrAficas y niveles socioecondmicos. 

La estandarizacidn de una forma anterior 
en 1988 reveld una intercsantc tcndcncia en 
comparacidn con los resultados para versiones 
que se estandarizaron varios anos antes. La 
muestra de 1988 demostrd niveles mAs altos de 
rendimiento, en el ordcn de 1 a 3 meses dc equi¬ 
valence de grado. Este patrdn de elevacidn len- 
ta del desempeflo en una prueba enfatiza la 
necesidad de reestandarizacidn anual o bienal 
de las baterias de pruebas de rendimiento. Lo 
que ha sucedido en ausencia de reestandariza- 
ciones oportunas de las principales pruebas de 
rendimiento es que los 50 estados de EUA pue- 
den informar con toda honradez que superan cl 
promedio nacional en pruebas grupales estan- 
darizadas (Cannell, 1988). 

Expertos en cl currfculo de matcrias y erf- 
ticos de la prueba consideran que los reactivos de 
la ITBS son pertinentes, lo cual habla en favor de 
su validez de contenido (Lane, 1992; Linn, 1989; 
Raju, 1992; Willson, 1989). Aunque no se ha es- 
tudiado dc manera extensa la validez predictiva 
de la ultima ITBS, la evidencia de edicioncs 
anteriores es muy alentadora. Por ejemplo, las 
calificaciones dc la ITBS se correlacionan dc 
manera moderada con las calificaciones en bachi- 
llerato (las r se encuentran alrededor de .60). 
La ITBS no es un instrumento pcrfecto, pero 
representa lo mejor que pueden producir los 
mdlodos actuates de desarrollo de pruebas. 


PRUEBA METROPOLITAN 
DE RENDIMIENTO 

La Metropolitan Achievement Test , MAT (Prue¬ 
ba Metropolitan de Rendimiento) data de 1930, 
cuando este instrumento se disefid para satisfa- 
cer las neccsidades de evaluacidn curricular de 
la ciudad de Nueva York. El prop6sito expreso 
dc la MAT consiste en “medir cl rendimiento 


de los alumnos en las principales Areas de habi- 
lidad y contenido del currfculo escolar". Las 
normas de la M AT se obtuvicron de manera si- 
multanca con las de la Otis-Lennon School 
Ability Test, OLSAT (Prueba de Capacidad Es- 
colar Otis-Lennon). 

La MAT es una baterfa multinivel disena- 
da para los grados escolarcs K a bachillcrato. 
El instrumento consta de dos componentes que 
pueden utilizarse separados o combinados; am- 
bos incluyen la Baterfa de Reconocimiento y las 
Baterfas Diagndsticas. La primera proporciona 
information referida a normas acerca dc habi- 
lidades acadlmicas tradicionales. Por ejemplo, 
las subpruebas en el nivel de bachillerato (gra¬ 
dos 10 a 12) incluyen las siguientes: 

Lecture 

MatcmAticas 

Lenguajc 

Ciencias naturales 

Ciencias sociales 

Habilidades de investigacidn 

La calificacidn de Habilidades de investigacidn 
se basa en reactivos relacionados con otras 
subpruebas. TambiOn se proporcionan califica- 
cioncs totales por baterfa. 

Las Baterfas diagndsticas consisten en tres 
pruebas disehadas como herramientas para la 
planificaciOn cducativa; Ostas encierran un en- 
foque referido a criterio para medir habilida¬ 
des fundamcntales en lecture, matemAticas y 
lenguaje. Por ejemplo, la prueba diagndsticade 
lecture para los grados K-2 incluye medidas 
dc discriminaciOn visual, reconocimiento de le- 
tres, discrimination auditiva, vocabulario vi¬ 
sual, fonemas/grafemas, vocabulario dentro de 
un contexto y comprensiOn de lecture. La MAT 
posee una confiabilidad excepcional, pero los 
crfticos han serialado que serfa deseable mayor 
evidencia de la validez relacionada con el cri¬ 
terio (Nitko, 1989; Rogers, 1989). 

PRUEBAS IOWA DE DESARROLLO 
EDUCAT1VO 

Las Iowa Tests of Educational Development, 
ITED (Pruebas Iowa de Desarrollo Educati vo), 
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qtic tienen un amplio uso, se publicaron por 
primera vez cn 1942, y despues se revisaron y 
rcestandarizaron cn varias ocasiones. HI pro- 
pbsito de la ITED es “cvaluar las habilidades 
jntelectuales importances en la vida adulta y 
proporcionar la base para el aprendizaje conti- 
nuo". A diferencia de muchas otras pruebas de 
(endimicnto que enfalizan habilidades vincu- 
Jadas con metas curricularcs especfficas, la 
intencidn de la ITED es medir las metas funda¬ 
mentals o habilidades generalizadas de edu¬ 
cation indcpendicntes del currfculo escolar, por 
tal razdn, sus reachvos subrayan habilidades de 
ordcn superior. En vez de someter a prueba tro- 
zos aislados de conocimiento, las preguntas de 
la ITED presentan problemas que requieren la 
sfntcsis de conocimiento o una solucibn de pa- 
sos multiples (figura 8-6). 

La ITED es un instrument disefiado para 
estudiantes de bachillerato. La prueba produce 


siete calificacioncs b.lsicas adenitis de dos cali- 
ficaciones derivadas: 

Corrcccidn e idoneidad de la expresidn. 

Vocabulario. 

Capacidad de pensamiento cuantitativo. 

Andlisis de materiales en ciencias sociales. 

Anblisis de materiales en ciencias naturales. 

Capacidad para interpretar materiales literarios. 

Usos de fuentes de informacibn. 

Puntuacidn mixta. 

Total de lecture. 

La puntuacidn mixta se basa en todas las 
subpruebas, mientras cl Total de lecture se ob- 
tiene de las subpruebas que requieren el andli- 
sis de material escrito. La ITED se afianza en 
cdiciones anteriores, de modo que sin importar 
la forma, nivel o edicidn, una calificacibn dada 
representa el mismo nivel de excelencia. El pro- 


Clcnclns soctales 

A/iundo 


Cualro de cada clnco medicos enlrevistcdos prefirleron 
JABON bAlsamo 

lias pruebas demuestran que JabOn BAlsamo me|ora los 
problemas de la piel mAs rApido que cualquier otro productol 


Con base en este anuncio, tcuAI de las slgulentes conclusiones, si es que alguna, es vAlida? 

A So ha demostrado denlfticamenle que la manera mAs rApIda de librarse de cualquier problems de la pi el es utillzar Jabdn BAlsamo 
B De las dnoo marcas principals* de jabones para la plel, sdio uno es mejor que Jabdn BAlsamo desde el punto de vista medico 
C De todos los mddreos que recomendaron product os para el culdado de la plel, cualro de cada etneo lecomendaron Jabdn BAlsamo 
D Ninguna de las conclusiones es vAlida 

Ciencias naturales 

Poco despuds de la plcadura de un mosquito, una persona enlermd de liebre ama/illa, cCual conclusion, si es que alguna, se puode 
iustificar solamonte a partlr de estas observadones? 

A Exisle evidenda insuTidenlo para derlvar cualesqulera de las conclusiones saguientes. 

8 Los mosquitos son causa directa de la liebre amarilla. 

C. El mosquito Introdujo un microorganismo en el lorrente sangulneo de la persona 
0 El mosquito portaba un organismo que causd la liebre amarilla 


Figura 8-6. Reactivos representatives de las Pruebas Iowa de Oesarrollo Educativo. 

Fuente: Reimpreso de Teacher. Administrator, and Counselor Manual; Iowa Tests o( Educational Development, 
Forms X-8and V'-fl(1988). Chicago, II Riverside Publishing Co. Copyright© 1988. Reproducidocon autortzacldn de 
la Riverside Publishing Company. 
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p6sito de vincular una prueba con cdiciones 
anteriores consistc cn facilitar las comparacio- 
nes longitudinales dc crecimiento dentro dc los 
individuos y simplificar la investigacidn a largo 
plazo dc las tendencias histdricas y educativas. 
En 1992, la ITED se reestandarizd con una con¬ 
siderable muestra nacional de estudiantcs de 
bachillerato. 


PRUEBAS VOCACIONALES 
Y DE APROVECHAMIENTO 

Los Tests of Achievement and Proficiency, TAP 
(Pruebas Vocacionales y de aprovcchamiento), 
son un instrumento discnado para proporcio- 
nar una valoraci6n amplia del progreso del alum- 
no hacia las rnetas acaddmicas tradicionales en 
bachillerato. La TAP es cl scgundo componen- 
tc del Riverside Basic Skills Assessment Program 
(Programa Riverside de Evaluacidn de Habili- 
dades Bisicas); el primer componente lo for- 
man las ITBS, que sc emplean en los grados K 
a 9 (y que se analizaron anteriormente). Como 
la ITBS, las norinas de la TAP se establccicron 
de modo simultdneo con las normas de la 
CogAT, una prueba dc capacidad que midc las 
capacidades de razonamiento verbal, cuantita- 
tivo y no verbal. Las subpruebas de la TAP 
miden rendimiento en comprcnsidn de lecture, 
matematicas, cxpresidn escrita, cmplco dc fuen- 
tes de informacidn, cicncias sociales y ciencias 
naturalcs. Tambidn se proporciona una puntua- 
cidn total o mixta. 

La TAP tambien produce una calificacidn 
dc aprovechamiento aplicado que evalua la ca¬ 
pacidad del alumno para manejar siluaciones 
rcales. Esta calificacidn reflcja la competencia 
del alumno cn la aplicacidn de habilidadcs 
matematicas y de comunicacidn para resolver 
problcmas de la vida cotidiana. Los rcactivos 
enfatizan comunicacidn de ideas por escrito, 
solucion matemitica dc problcmas, uso de ma- 
terialcs de referencia e intcrprctacidn dc mate- 
riales en tablas y grificas. Las normas de la TAP 
se establecieron junto con las de la ITED y la 
CogAT, y se rcestandanzo en 1992. 


PRUEBAS DE DESARROUO EDUCATTVO 
GENERAL 

Otre baterfa de prueba muy utilizada la consti- 
tuyen los Test of General Educational Develop, 
meat, GED (Pruebas de Dcsarrollo Educative 
General), desarrolladas por el Consejo Estadou- 
nidcnse de Educacidn y que sc aplican a nivel 
nacional en EUA para obtener el certificado de 
cquiValencia de estudios secundarios (GED 
Testing Service, 1991). La GED consiste en 
exdmenes de opcidn multiple en cinco dreas 
educativas: habilidades de redaccidn, ciencias 
sociales, cicncias naturalcs, interprelacidn de li- 
teratura y artcs y matemdticas. La seccidn de 
habilidadcs dc rcdaccidn tambidn contiene una 
pregunta de ensayo que las personas evaluadas 
deben responder por escrito. Dos lectorcs en- 
trenados califican de manera independiente la 
pregunta de ensayo segun un mdtodo de califi- 
cacidn holfstica de seis puntos. Los Icctores 
deben haccr un juicio sobre el ensayo con base 
cn su eficacia general en comparacidn con la 
de otros ensayos. 

La GED se presents cn 12 formas altcmas. 
Las confiabilidades de consistencia interna para 
las subescalas se encuentran, en su mayor parte, 
por encima de .90, con s61o algunas que llegan 
como minimo a .87. La liltima edicidn de la GED 
no presenta confiabilidades de formas altemas, 
pero los rcsultados de versiones anteriores se 
encontraban en gran medida desde la mitad 
hasta la parte superior del rango de .80, con 
excepcidn de habilidades de lecture (que ahora 
se denomina interpretacidn de literatura y artcs), 
para la cual la confiabilidad llegd a un nivel 
minimo de .76. La confiabilidad intercalifica- 
dores para las mucstras de redaccidn se localizd 
entre .6 y .7; estos datos indican que es apro- 
piado aplicar un criterio liberal para la aprobacidn 
cn esta subprueba, de modo que sc rcduzcan 
los errores de decisidn. Con respccto a la vali- 
dez, la GED licnc gran correlacidn con la prue¬ 
ba de lecture al momento de la graduacidn que 
se emplea en Nueva York (r = .77). Lo que es 
mis, las normas para aprobar la GED son mis 
rigurosas que aqudllas empleadas en la mayor 
parte de las escuelas de educacidn media. 
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En 1985, entre 27 y 33% de los estudiantes que 
sc graduaron dc prcparatoria a nivel nacional 
hubieran sido incapaces de aprobar las Pruebas 
GED (Whitney, Malizio y Patience, 1985). 

La GED enfatiza conceptos amplios en vez 
de hechos y detalles especfficos. En general, 
su propdsito es permitir que los adultos que no 
terminaron el bachillerato prueben que han ob- 
tenido un nivel equivalente de conocimiento a 
partir de sus experiencias o de estudios inde- 
pcndientes. Los empleadores consideran a la 
GED como un equivalente (si no es que supe¬ 
rior) a obtencr un diploma de educacitSn media 
superior. El desempefio exitoso de esta prue- 
ba permite que los individuos hagan solicitudes 
a universidadcs. busquen empleos y soliciten 
promociones que requieren un diploma de 
educacidn media superior. Rogers (1992) y 
Trevisan (1992) proporcionan reserias inusual- 
mente completas de la GED. 

OTRAS PRUEBAS ESTANDAR1ZADAS 
DE RENDIMIENTO PARA GRUPOS 

Ademils de las baterfas que se listan antes, al- 
gunas pruebas estandarizadas de rendimiento 
que se emplcan de manera giupal merecen un 
comentario breve. Dado que dslas sc asemejan 
en gran medida a los instrumentos que se ana- 
lizaron antes, se proporciona s<51o un breve lis- 
tado. Las Sequential Tests of Educational 
Progress , STEP-III (Pruebas Secuenciales dc 
Progreso Educativo), se organizan en dos ba¬ 
terfas, una que se utiliza con los grados K-3 
y la otra que se emplea para los grados 3-12. 
La baterfa basica STEP-III evalda las siguicn- 
tes habilidades educativas: lectura, cscritura, vo- 
cabulario, cdlculo matematico y conceptos 
matcmdticos. Pruebas adicionales miden logros 
en ciencias sociales, ciencias naturales, habili¬ 
dades de estudio y comprensidn oral (habilida¬ 
des audit!vas). La STEP-III es una prueba 
complementaria de las School and College 
Ability Tests, SCAT-III (Pruebas de Capacidad 
Escolar y Universitaria). 

La muy utilizada Stanford Achievement 
Series (Serie de Pruebas de Ejccucidn Stanford) 
es uno de los programas de prueba mds antiguos 


y prestigiosos en EUA. La serie incluyc tres ba- 
tcn'as relacionadas que cubren los grados K-13: 
la Stanford Early School Achievement Test, 
SESAT (Prueba Stanford de Rendimiento Es¬ 
colar Temprano), para ninos en jardfn de ninos 
y primer grado, la Stanford Achievement Test, 
SAchT (Prueba de Ejccucidn Stanford), para 
nifios del primer grado a bachillerato, y la 
Stanford Test of Academic Skills, TASK (Prue¬ 
ba Stanford de Habilidades Acaddmicas), para 
bachillerato y primer aho de universidad. Los 
crfticos son cautos en cuanto a la SESAT debi- 
do a que el valor de la prueba se fundamenta 
solamente en su validez de contenido. Poco se 
conoce acerca de su confiabilidad test-retest, 
su validez rclacionada con el criterio y su vali¬ 
dez de constructo (Ackerman, 1992; Carpenter, 
1992). La SAchT se tiene en gran estima debi- 
do a su excelente cobertura referida a normas 
de un currfculo educativo consensado, equili- 
brado y representative a nivel nacional (Brown, 
1992; Stoker, 1992). La TASK tiene excelentes 
caracterfsticas psicomdtricas pero, en su inten- 
to por abarcar el rendimiento en bachillerato y 
universidad, esta prueba emprende una tarea 
diffcil. Despuds de todo, existe un modesto 
acuerdo en cuanto a las intenciones curriculares 
de la primaria, secundaria y preparatoria, pero 
^cudles son las metas educativas del primer aiio 
de universidad? 


B PRUEBAS DE RENDIMIENTO 

CON PROP6SITOS ESPECIFICOS 


Las pruebas de rendimiento pueden utilizarse 
para muchos propdsitos aplicados importantes, 
incluyendo la estimacidn del conocimiento en 
campos avanzados y la evaluacidn de la com- 
petencia profesional. En esta ultima seccidn se 
examinardn das pruebas de rendimiento con pro- 
ptSsitos especfficos. El College-Level Examination 
Program CLEP (Programa de Exdmenes Uni- 
versitarios), es un programa ampliamentc utili- 
zado a travds del cual los estudiantes pueden 
demostrar su rendimiento a nivel universitario 
y recibir erddito o excncidn en ciertos cursos 






356 • Evaluacidn psicologlca: Historia, principlos y aplicaciones 


(Capitulo 8) 


uni versitarios. El National Teacher Examination . 
NTE (Examen Nacional para Maestros), es una 
prueba poldmica que requieren muchos estados 
para extender la certificacidn a los maestros. 

PROGRAMA DE EXAMENES 
UNIVERSITARIOS 

El CLEP es uno dc dos programas nacionalcs 
de pruebas a travds del cual los estudiantes pue- 
den obtenererdditos uni versitarios mediante un 
examen, sin inscribirsc en los cursos. El otro 
programa es el ACT Proficiency Examination 
Program (Programa ACT de Examen de 
Capacidades), el cual no sc analizarA aquf. 
La College Board (Junta Universitaria) aplica 
cl CLEP con respaldo econdmico de la Carnegie 
Corporation de Nueva York. El propdsito ori¬ 
ginal del programa era apoyar a estudiantes no 
tradicionalcs como los veteranos que regresa- 
ban del frente y los adultos mayores que habfan 
obtenido valiosas expcricncias dc aprendizajc 
fuera del saldn de clases. No obstante, son prin- 
cipalmente los ambiciosos estudiantes de edu- 
cacidn media superior quienes se registran ahora 
para realizar los cxAmenes del CLEP. Algunos 
estudiantes comienzan la universidad con casi 
un semestre complcto de erdditos obtenidos a 
travds del CLEP y programas similares. 

El CLEP consiste en dos categorfas de exA- 
menes. Cada uno dc los cinco cxAmenes gene- 
rales es una prueba del material que se imparte 
en los cursos bAsicos que toma la mayorfa de 
los estudiantes como parte de los requisitos ge¬ 
nerates de educacidn. Las Areas evaluadas in- 
cluyen composition en inglds, humanidadcs, 
matemAticas universitarias, ciencias naturales 
y ciencias sociales/historia. Exceplo por la prue¬ 
ba de composicidn en inglds, que incluye un 
ensayo de 45 minutos, las pruebas generates son 
cxAmenes de opcidn multiple con duracidn de 
90 minutos. Las caiificacioncs satisfactorias en 
cada prueba general proporcionan por lo co- 
mun de 3 a 6 horas de erddito semestral. 

Cada uno dc los 30 ExAmenes TemAticos 
es una prueba de opcidn multiple con duracidn 
de 90 minutos que se aplica en dos seccioncs 
cronometradas por separado. Cuatro dc estas 


pruebas tambidn incluyen una scccidn de ensayo 
que es requisito para algunas universidades. 
Pruebas de muestra incluyen temas sobre 
literatura estadounidense, francesa, alemana, 
espanola. gobiemo estadounidense, macroeco- 
nomfa, introduccidn a la psicologla, Algebra, 
biologfa, qufmica, ciencias informAticas y 
contadurfa. Las caiificacioncs satisfactorias en 
cada prueba temAtica proporcionan ires o mAs 
horas de erddito semestral. 

Las calificaciones de los ExAmenes Gene- 
rales del CLEP se presentan en una escala dc 
200 a 800 puntos, con un promedio de 500 y 
desviacidn estAndarde 100. Para los ExAmenes 
TemAticos, las calificaciones van en una escala 
dc 20 a 80, con un promedio de 50 y desvia¬ 
cidn estAndar de 10. Los grupos de referenda 
para dstas fueron estudiantes voluntarios que 
terminaron los cursos en las Areas cspecifica- 
das. fistos se rcclutaron de una seleccidn no 
aleatoria, pero supuestamente representativa, de 
colegios y universidades de EUA. En general, 
las calificaciones tienen confiabilidad clevada, 
con coeficientes por mitades que se colocan 
principaimcnte en el rango del .90. La validez 
de los ExAmenes TemAticos se ha evaluado al 
correlacionar las calificaciones del CLEP con 
aqudllas finales en los cursos rclacionados. La 
mayor parte de los coeficientes de correlacidn 
sc encuenlra en los rangos de .40 y .50, lo cual 
sustenta la validez concurrente de estas prue- 
bas. Se supone que la validez de los ExAmenes 
Generalcs es buena, pero se le ha establecido 
de manera mcnos precisa. 

El programa CLEP ha recibido comenta- 
rios satisfactorios de los revisores, pero tam- 
bidn liene un lado potencialmente negativo. En 
particular, algunos de los estudiantes podrfan 
pasar la prueba y no tomar algunos cursos uni- 
versitarios que hubieran resultado enriquece- 
dores, inspiradorcs e incluso hubieran cambiado 
su vida. Por cjemplo, es posible tener conoci- 
mientos objetivos acerca de arte, musica o arte 
dramAtico y, por lanto, aprobar una prueba del 
CLEP en una o mAs de estas Areas. No obstan¬ 
te, en la busqueda ambiciosa por terminar con 
rapidez la universidad, los estudiantes podrfan 
pasar por alto importantes experiencias para su 
desarrollo personal. 
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EXAMEN NACIONAL PARA MAESTROS 

El National Teacher Examination , NTE (Exa- 
mcn Nacional para Maestros) es, dc hecho, una 
scric dc prucbas publicadas por el Educational 
Testing Service y se conoce dc mancra mis for¬ 
mal como Praxis Series (Serie Prdctica). De los 
<10 estados quc requieren la evaluation como 
parte del proccso para otorgar licencias. 36 uti- 
lizan la Serie Prdctica, lo cual explica por qud 
la prueba se conoce de modo informal como 
National Teacher Examination o NTE. La Serie 
Prdctica sc aplica a nivel nacional y se actuali- 
za y mejora continuamcntc. Las trcs categories 
dc cvaluacion corresponded a los principalcs 
hitos en cl dcsarrollo de la profesidn en el drea 
de cnsefianza: 

• Prdctica I (Evaluacidn dc habilidadcs acade¬ 
mic as): ingrcso a un programa de cntrena- 
miento como maestro. 

• Prdctica II (Evaluacidn dc matcrias): gradua- 
ci6n de una universidad e ingreso a la profc- 
si6n. 

• Prdctica III (Evaluaciones del desempeno en 
el saldn de clases): primer afio de ensenanza. 

La prueba inicial, Prdctica I, se realiza al inicio 
dc la carrcra universitaria del estudiante para 
evaluar habilidadcs de lectura, redaccidn y 
matcmdticas, esenciales para el dxito dc cual- 
quier maestro. Se requiere una caiificacidn 
aprobatoria en csta prueba de opcidn multiple 
antes de que el estudiante pueda conlinuar con 
su especializacidn en cducaci6n. Estas pruebas 
pueden responderse en el formato tradicional 
de Idpiz y papel o como una prueba para com- 
putadora que se diseha para el desempeno con- 
tinuo de cada candidato. Una ventaja de la 
cvaluacidn por computadora cs su disponibili- 
dad en todo momento, mientras que la versi6n 
tradicional s61o sc aplica seis veces por ano. 
Prdctica II evaliia el conocimicnto que tiene un 
candidato sobre la materia quc impartird, asf 
como su conocimiento sobre la enseftanzn 
de la materia. Se encucntran disponibles mds de 
120 dreas de contenido (todas de opcidn multi¬ 
ple). Prdctica III es una valoracidn en clase que 
realizan examinadores locales entrenados, los 


cuales utilizan criterios cstructurados validados 
a nivel nacional. 

La confiabilidad de las pruebas Prdctica I 
y Prdctica II estd mds alld de cualquier duda. 
De mancra similar, la validez de contenido dc 
estas pruebas es sobresaliente, debido a que se 
les construyd y refind de manera cuidadosa con 
ayuda de muchos expertos y consumidores de 
pruebas. Lo que cs mcnos claro cs la validez 
predictiva de la Serie Prdctica, ya que existc 
poca informacidn para demostrar que las bue- 
nas calificaciones o valoraciones prdcticas pre- 
dicen una buena capacidad para la ensenanza o 
viceversa. Por supuesto, parte de la dificultad 
en cste caso es cncontrar una definicidn y me- 
dida adecuadas de lo que es la “buena capaci¬ 
dad para la cnsefianza". Es probable que el NTE 
satisfaga un propdsito util al requerir que los 
futuros macstros posean niveles minimus de 
conocimiento en sus disciplinas, pero la prue¬ 
ba tambidn hace surgir preguntas diffeiles rela- 
Uvas a la mancra en que la sociedad identifies 
a los maestros prometedores. ^Es suficiente el 
conocimiento objetivo? ^No deberfa insistirse 
tambidn en quc los macstros posean entusias- 
mo por su materia) y capacidad para inspirar a 
los nifios? Estos son aspectos que no sc captan 
fdcilmente a travds de pruebas objetivas. 



FALSEAMIENTO: EL LADO 
OSCURO DE LAS PRUEBAS 
DE RENDIMIENTO 


La perspectiva prevaleciente enlre cl publico en 
general es que el falscamiento ocurre en pocas 
ocasioncs o nunca en los programas de prueba 
aplicados a nivel nacional. Sc tiendc a pensar 
que los riesgos son demasiado elevados y que 
quienes falsean los rcsultados tienen oportuni- 
dadcs demasiado limitadas como para tencr 
dxito. Por tanto, se confia en que el fraude en 
las pruebas debe ser poco comun; por desgra- 
cia, es probable que este punto de vista sea inge- 
nuo. Despuds dc todo, un creciente numero de 
personas debe aprobar un examen para ingresar 
a la universidad, obtener un emplco 0 lograr un 
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ascenso. Lo que es mas, cada vez cs mis frc- 
cuente que se evalue a los funcionarios escola- 
res con base en las calificaciones promedio de 
prueba en su distrito. Prccisamente debido a los 
fuertcs intercses que existen, individuos poco 
escrupulosos intentardn enganar al sislema. 

Considcre.se el caso de las calificaciones 
superiores de una prueba cn una aclamada cs- 
cuela primaria en Connecticut (Associated 
Press, 4 de mayo de 1996 y 15 dc marzo de 
1997). La rcputacidn sobresaliente de la escue- 
la se bas6 cn las alias calificaciones dc examcn 
obtenidas con la 1TBS, que se aplied a los ni- 
fios de primero, tercero y quinto grados. La es- 
cuela habfa ganado preseas del Education 
Department de EUA y se describid como una 
de las mejores cscuelas primarias del pafs en 
una destacada revista. No obstante, por un des- 
cubrimiento casual, el personal del distrito es- 
colar observd un gran numero de borraduras 
en las pruebas de csta escuela y notified al edi¬ 
tor de la prueba. Al inspeccionarlas de manera 
mds cuidadosa, los editores encontraron un 
numero excesivamente elevado de borraduras 
— 9% — lo cual era de 3 a 5 veces mayor que 
en dos cscuelas vecinas. Aun mds sospcchoso 
resultd cl hecho de que 89% eran cambios de la 
respuesta incorrecta a la comecta. Con base cn una 
repeticidn de la prueba bajo cstrecha supervi- 
sidn, la editorial de la prueba encontrd “de manera 
clara y concluyente” que habfa alteraciones. El 
director renuncid bajo acusaciones de que dl era 
cl responsable de la manipulacidn. 

En 1997 se descubrid en Louisiana un caso 
cspecialmente flagrante de falseamiento en 
pruebas nacionales. Este caso implied la circu- 
lacidn en masa del examcn del Educational 
Testing Service (ETS) que se aplicaba a los 
maestros que deseaban ser directores dc una 
escuela. Como se informd en el New York Ti¬ 
mes (28 de septiembre dc 1997), copias de los 
145 reactivos de la prueba, junto con las res- 
puestas correctas, habfan circulado entre los 
maestros a lo largo de todo el sur de Louisiana, 
muy probablementc durante varios anos. En un 
estado clasificado como cl tillimo o casi ultimo 
cn el fndice educativo, pareefa que muchas per¬ 
sonas potencialmente poco calificadas habfan 


comctido fraude para obtener la direccidn dc 
las escuelas. El ETS manejd este caso de ma¬ 
nera discreta al pcdirle a mils dc 200 maestros 
que volvieran a realizar la prueba para “confirmar" 
sus calificaciones iniciales. Por desgracia, el caso 
de Louisiana no es un suceso aislado. El artfeu- 
lo del New York Times incluye esta inquietante 
conclusidn: 

En numerosos incldentes a lo largo del pafs, el 
ETS ha confrontado un caso tras otro de falsea¬ 
miento, pero le ha ocultado esta informacldn al 
publico y no ha lomado medklas agresivas para 
garantizar ta integridad de sus pruebas, segiin lo 
demuestran documentos Memos y entrevistas 
con sus fundonarios actuates y pasados. 

Entre los cjcmplos citados, se suponc que el 
ETS no supervisd cl manejo dc la prueba del 
gobiemo federal para inmigrantes que desean 
obtener la ciudadanfa, con cl factible resultado 
de que los supervisores de la prueba aceptaron 
sobomos. Las pruebas dc dominio del ingles 
para estudiantes extranjeros tambidn fueron 
vulnerables al falseamiento. En 1994, el ETS 
canceld las calificaciones dc 30 000 cstudian- 
tes de China despuds de descubrir una red 
delictiva que vendfa los cxdmenes en el exte¬ 
rior. En otro caso, procuradores federales des- 
cubrieron una red dcdicada al falseamiento de 
pruebas en la que participaban cientos de estu¬ 
diantes que pagaban miles de ddlares cada uno 
por las respuestas del GRE y exdmencs simila- 
res. Este fraude implied una conocida cstafa con 
husos horarios en la que personas experimen- 
tadas en realizar pruebas pasaban los exdme- 
ncs en la ciudad dc Nueva York y despuds 
enviaban las respuestas a clientes que contesta- 
ban las pruebas en husos horarios posteriores. 

Las prdcticas deshonestas c inapropiadas 
de los funcionarios escolares tienen una parti- 
cipacidn en la recientc inflacidn de las califica¬ 
ciones de las pruebas grupales de rendimiento 
que tienen normas nacionales. Por dcfinicidn, 
en el caso de una prueba referida a normas, 50% 
de las personas evaluadas debe tener califica¬ 
ciones por encima del pcrccntil 50, y 50% por 
debajo de esc pcrccntil. Si se utiliza la misma 
prueba con una muestra amplia de sistemas 
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escolares tfpicos y representative®, las califi- 
caciones promedio de los sistemas escolares 
deberfan dividirse de mancra uniformc —cerca 
de la mitad por encima de la norma nacional del 
percentil SO y la otra mitad por debajo de dste. 

Segun una rcciente encuesta presentada en 
los medios noticiosos (Foster, 1990), casi to- 
dos los estados de EUA afirman que las califi- 
caciones promedio de rendimiento para sus 
sistemas escolares superan el percentil 50. La 
imagen demasiado optimista acerca del apro- 
vechamiento estudiantil que resulta de ello se 
denomina Efecto del Lago Wobegon, con re¬ 
ferenda al mftico pueblo de Minnesota, deseri- 
to por el humorista Garrison Keillor, donde 
"todos los niflos son superiores al promedio”. 

^Cdmo surge la inflacidn de las califica- 
cioncs en pruebas de rendimiento? Segun 
Cannell (1988), la causa principal son los ad- 
ministradores cducativos que estdn desespera- 
dos por demostrar la excclcncia de sus sistemas 
escolares. Precisamcntc debido a que la socie- 
dad estadounidense le da tanta importancia a 
los resultados de las pruebas de rendimiento, 
cn apariencia algunos educadores ayudan a sus 
alumnos a falsear las pruebas estandarizadas. 
El supuesto falseamiento incluye los siguien- 
tes puntos: 

• Maestros y directores entrenan a los alumnos 
en las respucstas para la prueba. 

• Los examinadores concedcn mds tiempo del 
asignado para contestar las pruebas. 

• Los administradores alteran las hojas de res- 
puesta. 

• Los maestros ensenan directamente con refe¬ 
renda a los reactivos especfficos de prueba. 

• Los maestros hacen copias de las pruebas para 
proporcionarlas a sus alumnos. 

Cannell senala que mds de 300 maestros y ad¬ 
ministradores escolares respondieron a su anun- 
cio en una publicacidn periodica del ramo y 
admitieron que ellos o sus colegas habian alte- 
rado las pruebas o ayudado a los estudiantes de 
maneras inapropiadas. Estas faltas constituyen 
una crisis silenciosa que continua sin disminuir. 
Otra consecuencia del Efecto del Lago Wobegon 
es la probabilidad de que los cditorcs de prue¬ 


bas y los revisores federales aumenten sus es- 
fuerzos por supervisar la seguridad de las prue¬ 
bas. En resumen, la importancia que la sociedad 
le adjudica a las calificaciones en las pruebas 
de rendimiento ha provocado diversos efectos 
secundarios desagradables que socavan los fun- 
damentos de los programas de pruebas grupales 
con normas nacionales. 

Moore (1994) informa sobrc un caso es¬ 
pecial cn rclacidn con las evaluacioncs educati- 
vas, a saber, las consccuencias a nivel de los 
distritos de las piucbas de rendimiento obliga- 
torias por 6rdenes de un tribunal. Estc autor hizo 
una encuesta con 79 maestros de tcrccro a quin- 
to grado en un pueblo del medio oeste cn el 
que los tribunales requerfan una prueba cstan- 
darizada para determinar la eficacia de un cs- 
fuerzo para eliminar la segregacidn. La piueba 
en cucstidn, ITBS, es una prueba grupal deren- 
dimiento muy respetada que requiere el segui- 
miento estricto de instrucciones y Ifmites de 
tiempo para obtener resultados vdlidos (vdase 
antes). No obstante, los maestros le concedfan 
poco valor al programa de pruebas y se queja- 
ban de que sus bcneficios no superaban el tiem¬ 
po y costos implicados. Como consecuencia de 
su dcsprccio por cste esfuerzo, la evaluacidn 
no estandarizada era prdcticamente la regia mils 
que la excepcidn. Los maestros rcalizaban di- 
versas pr£cticas no estandarizadas, la mayor 
parte de las cuales tendfan a inflar las califica- 
ciones de la prueba. Las prdcticas inapropiadas 
de examen inclufan elogiar durante la prueba a 
los estudiantes que respondfan de mancra co¬ 
rrects una pregunta (67%), utilizar preguntas 
de la prueba del ado anterior como prdctica 
(44%), volver a anotar la clave en la hoja de 
respuestas de un alumno porque el cstudiantc 
simplcmentc habfa “confundido" la respuesta 
(26%), dar a los estudiantes tanto tiempo como 
necesitaran (24%), aplicar a los estudiantes 
reactivos que estaban directamente fucra de la 
prueba (24%) y dar indicios o claves durante 
la prueba (23%). En general, Moore (1994) se¬ 
nala que los maestros modificaron tanto sus es- 
fuerzos al dar instrucciones como el currtculo 
de materias antes de que sus estudiantes con- 
testaran la prueba. Mils de 90% de los maestros 
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anadicron al cum'culo Iccciones rclacionadas 
con la prueba, y mis de 70% climinaron temas, 
de modo que pudieran tcner mis tiempo para 
ocuparlo en habilidades relacionadas con la 
prueba. Con toda seguridad, el que cstos cam- 
bios scan deseables esti abicrto a debate. Moore 
(1994) concluye: 

La evaluackSn estandarizada ha tenldo un pa pel 
central en la educacidn durante muchos a nos. 

Lo que han ctemostrado redentemente los estudios 
sobre el Impaclo de los programas de evalua- 
d6n es la credente dependence en las callticado 
nes de una prueba para la toma de declsiones y 
el potoncial cada vez mayor de uso impropio de 
las mismas. Es necesarlo que aquellos que de- 
torminan los procedimlentos en educacidn y 
politics atiendan al importante vinculo entre ins- 
truccion y prueba y que garantlcen que los maes- 
tros se Inlegren a los esfuerzos de evaluackSn en 
lugar de aislarse de etlos. 

Eq resumen, lo que demuestra este cstudio es 
que las pruebas educativas obligatorias pueden 
tcner la consecucncia no anticipada de conta- 
minar la validez de una prueba meritoria —en 
especial cuando los principales interesados no 
tienen opinidn dentro del proceso. 


En nuestro caso no es posible analizar to- 
dos los efectos colatcrales no intencionales de 
las pruebas de rendimiento educativo, debido a 
que las posibilidades son casi infinitas. Por 
cjcmplo, £qud sucede con los efectos modifi- 
cadores de los programas de pruebas de rendi¬ 
miento sobre los currfculos escolares? Como 
se ha visto en el estudio de Moore (1994), los 
maestros cambian sus pricticas de clasc para 
ayudar a los alumnos a obtencr buenas calift- 
caciones en las pruebas; no obstante, al ense- 
nar con el propdsito de pasar la prueba, los 
educadores pueden enfatizar el conocimiento 
objetivo en vez de impartir una capacitacidn 
general para pensarcon claridad y resolver pro- 
blemas. En conclusidn, parece ser que el dnfa- 
sis excesivo en las pruebas de rendimiento con 
normas nacionales para la seleccidn y evalua- 
cidn promueve conductas inapropiadas, inclu- 
yendo fraude evidente y falseamiento de parte 
de alumnos y funcionarios escolares. <,Qud tan 
extendido esti el problema? Aunque se vi ve con 
la suposicidn optimista de que el fraude en los 
programas nacionales de prueba es poco comun, 
la perlurbadora verdad es que en realidad no se 
sabe con qud frecuencia ocurre. 


|| RESUMEN 


1. Las pruebas de rendimiento sc cmplcan para 
medir el logro de las habilidades que se 
ensehan dentro de cscuelas o programas de 
entrenamiento. Las pruebas grupales de ren¬ 
dimiento se utilizan principalmente en el sa- 
I6n de clases, mientras las individuates se 
emplean en entomos clfnicos o educativos 
individuales. 

2. La distincidn entre capacidad, aptitud y 
rendimiento es confusa. De hecho, las co- 
rrelaciones entre estos tres tipos de medi- 
das son, con frecuencia, muy elevadas; no 
obstante, las aplicaciones tfpicas de estas 
pruebas son difcrcntes: las pruebas de apti¬ 
tud se utilizan para predecir el desempeho 
futuro, mientras las de rendimiento estiman 
el funcionamiento actual. 


3. Las funciones de las pruebas de rendimien¬ 
to educativo incluyen la deteccidn de una 
posible discapacidad para el aprendizaje, 
identificacidn de fortalezas y debilidades 
individuales. agrupamiento de estudian- 
tes y valoracidn del bxito de programas edu¬ 
cativos. 

4. Los editores de pruebas han dcsarrollado 
varias baterfas multi nivel para satisfacer las 
necesidadcs que tienen los sistemas esco¬ 
lares de evaluar el rendimiento educativo. 
En una baterfa multini vel. los protocolos de 
prueba contienen secciones superpuestas y 
los estudiantes en diferentes ni veles de gra- 
do inician y terminan con los materiales de 
la prueba en los lugares apropiados para su 
grado. 
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5. Las ITBS constituycn una batcrfa multinivcl 
de pruebas de rendimiento que cubre los 
grados K-9. Sus normas se obtuvieron al 
mismo tiempo quc las de la CogAT, y la 
ITBS mide el rendimiento en areas b£sicas 
como vocabulario, comprensidn de lectu- 
ra, ortograffa y matemdticas. 

6. La MAT consta de dos componentes que 
pueden utilizarsc por separado o en combina- 
cidn: Baterfa de Reconocimienlo (evaluation 
referida a normas de habilidades ac add mi¬ 
cas tradicionales) y Baterfas Diagndsticas 
(enfoque referido a critcrio con propdsitos 
de planificacidn educativa). 

7. A diferencia de muchas otras pruebas de 
rendimiento quc enfatizan habilidades liga- 
das con metas curriculares especfficas, la 
intencidn de las ITED es medir las metas 
fundamentales o habilidades generalizadas 
de la educaciOn indcpcndicnlcs del cumcu- 
lo de matcrias. Por tal razOn. los rcactivos 
empleados en la ITED destacan habilida¬ 
des de pensamiento de orden superior. 

8. Las TAP se disefiaron para proporcionar una 
evaluaciOn amplia del progreso del alumno 
hacia las metas acadOmicas tradicionales de 
bachillerato. La TAP es una prueba relacio- 
nada con la ITBS y sus normas sc obtuvieron 
de manera simultOnea con las de la CogAT, 
una prueba que mide capacidades de razo- 
namiento verbal, cuantitativo y no verbal. 

9. Otra batcrfa de pruebas de rendimiento de 
empleo generalizado la constituyen las 


GED, desaiTolladas por el American Council 
on Education y quc se aplican a nivel na- 
cional para obtener cl certificado de equi¬ 
valence de bachillerato. La GED consiste 
en examenes de opciOn multiple en cinco 
dreas educativas, e incluyc preguntas de en- 
sayo para evaluar habilidades de redacciOn. 

10. El CLEP permite que los estudiantes ob- 
tengan creditos uni versitarios a travds de un 
examen sin inscribirse a los cursos. Exis- 
ten cinco exdmenes generales (p. ej., hu- 
manidades, matcmdticas universitarias) y 30 
exdmenes especfficos (p. ej., literatura es- 
tadounidense, introducciOn a la psicologfa, 
algebra, biologfa). 

11. El NTE, que publica el Educational Testing 
Service, se conoce de manera mds formal 
como Seric Prdctica. Esta valoraciOn con¬ 
siste en tres categorfas (habilidades aca- 
ddmicas, conocimiento de la materia y 
desempeno en cl salOn de clase). Las eva- 
luaciones temdticas son un requisito previo 
en muchos estados para obtener la licencia. 

12. Se desconoce la incidcncia del falscamicn- 
to en pruebas de rendimiento de aplicaciOn 
nacional. Sin embargo, en anos recientes 
han surgido muchos informes que incluyen 
la altcracidn de hojas dc rcspucsta por par¬ 
te de funcionarios escolares, la circulacidn 
en masa de algunos exdmenes para licencias 
y las prdcticas inapropiadas de prueba de 
algunos macstros individuates (p. ej. conce- 
der tiempo adicional para terminar la prueba). 
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La evaluacibn neuropsicolbgica es la 
aplicacibn de pruebas especializadas con pro- 
pbsitos de diagnbstico y tratamiento de indivi- 
duos en los que se sospecha o conoce disfuncidn 
cerebral. Las pruebas neuropsicolbgicas son es- 
pecfFicas debido a su vfnculo deniostrado con 
las funciones cerebrales (Lezak, 1995). En tbr- 
minos especfficos, cualquier prueba o tbcnica 


que sea sumamente sensible a los efectos del 
deterioro cerebral —y en especial una prueba 
o tecnica que permita hacer inferencias sobre 
el lugar. tipo y grado del deterioro— tendrfa la 
categoria de procedi miento neuropsicolbgico. 
El propbsito de este capftulo es introducir al 
lector a las pruebas, conccptos y mbtodos de 
este tipo. Ademiis, se incluye un enfasis secun- 
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dario en la evaluacidn dc los trastomos relacio- 
nados con la edad, como la enfermedad dc 
Alzheimer, dcmcncia con infartos multiples 
(accidente cerebrovascular) y depresidn de la 
vejez, debido a que estos problemas pueden 
comprendcrse mejor dentro de un contexto 
neuropsicoldgico. En cl Tema 9A, Compcndio 
dc ncuropsicologfa, se proporciona una revision 
condensada dc las funciones cerebralcs huma- 
nas. Tambidn sc presta especial considcracidn 
a los trastomos del envejecimiento y se rcse- 
nan los enfoques mddicos a la imagenologfa del 
cerebro. El propdsito central de estc tema es 
preparar al lector para proseguir con el andlisis 
de los procedimienlos neuropsicoldgicos y 
geridtricos de evaluacidn. En cl Tema 9B. Eva¬ 
luacidn ncuropsicoldgica y geridtrica, se anali- 
za la naturaleza y cmplco de las pnneipales 
pruebas ncuropsicoldgicas y procedimienlos de 
evaluacidn en geriatrfa. 

La neuropsicologta es el estudio dc la re- 
lacidn entre funcidn cerebral y conducta 
(Cytowic, 1996; Kolb y Whishaw, 1990); no 
floreci6 sino hasta la segunda Guerra Mun- 
dial. cuando los psicdlogos y neurdlogos se en- 
frentaron con miles dc soldados que tenfan 
lesiones cerebralcs y que requerian dc evalua¬ 
cidn y rchabilitacidn (Aita. Armitage. Reitan y 
Rabinowitz, 1947; Goldstein, 1944). Era una 
circunstancia sombrfa para la innovation, pero 
la carnicerfa ocurrida en la guerra obligd a los 
psicdlogos a desarrollar nuevas herramientas 
para comprender los efectos del dano cerebral. 
Asf, mientras la humanidad devastaba a su pro- 
pia especic durante csta guerra, varios especia- 
listas forjaron una nueva cspccialidad, la 
ncuropsicologfa clfnica, para ayudar a manejar 
las consecuencias. El objetivo inicial y funda¬ 
mental de csta novel disciplina consistid en 
determinar las relaciones entre la lesidn cere¬ 
bral y el desempeho en pruebas psicoldgicas 
(Ejcmplo de caso 9-1). 

El punto central de la ncuropsicologfa es la 
promocidn de una ciencia de la conducta hu- 
mana fundamentada en la funcion cerebral 
humana (Kolb y Whishaw, 1990). Los estudian- 
tca de la evaluacidn ncuropsicoldgica deben 
estar familiarizados con los aspcctos esencia- 


les de la funcidn cerebral, si es que han de ap rt . 
ciar el papel de las pruebas en el diagndstic 0 
dc los padecimientos relacionados con el dc. 
terioro cerebral. En este tema, se presentaun 
compcndio de tdrminos y conceptos neurold- 
gicos, incluycndo una revisidn de la anatomfa y 
funcidn ccrebrales, con un andlisis de los enfo- 
ques mddicos a la imagenologfa del cerebro. 
Tambidn se toca de mancra breve cl tema dc 
los principales tipos de ncuropatologfa que po- 
drfan altcrar el funcionamiento normal del ce¬ 
rebro, con especial dnfasis en los ancianos. 

ANATOMIA DEL CEREBRO 


Por convencidn, el sistema nervioso se divide 
en Sistema Nervioso Central (que consiste cn 
cerebro y mddula cspinal) y Sistema Nervioso 
Perifdrico (que incluyc los pares craneales y la 
red de nervios que emana de la mddula espinal). 
La evaluacidn neuropsicoldgica inlcnta deter¬ 
minar la rclacidn entre cerebro y conducta, de 
modo que aqudl sera el principal punto de aten- 
cidn de este andlisis. 

El cerebro pesa cerca de 1.300 kg. Se for¬ 
ma principalmcntc de dos componentes, ncu- 
ronas y cdlulas glialcs. Durante deccnios se ha 
crefdo que las neuronas no se rcproduccn; no 
obstante, investigaciones rccicntcs sugicren que 
los humanos pueden tener una capacidad 1 1 mi 
tada para reprodueir neuronas, cn especial en 
las dreas del cerebro que son importantes para 
cl aprendizaje y la memoria (Associated Press, 
30 de octubre de 1998). Las mds numerosas 
cdlulas gliales, que ticncn la capacidad de re- 
produccidn prolffica, proporcionan diversascla- 
scs dc apoyo cstructural a las neuronas. 

Los 10" o 100 mil millones de neuronas cn 
el cerebro se distribuyen en redes complcjas 
que en gran medida han desafiado a la com- 
prensi6n. En parte, la cualidad inescrutable del 
cerebro sc dcriva dc su complcjidad computa- 
cional. Las neuronas se comunican al enviarse 
impulsos clectroqufmicos dc todo o nada, unas 
a otras. Cada una podrfa enviar transmisiones a 
miles, y quizd deccnas dc miles, de otras 
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Ejemplo DE CASO 9-1 

DISFUNCI6N CEREBRAL Y RESULTADOS DE PRUEBA 

Se pidi6 a un neuropsicdlogo qua evaluara a un estudiante de los primeros niveles da universidad, 
cuyas bajas califlcaciones aran fuente da desconcierto para el asesor, los padres a Induso el 
psiquialra de esle alumno, qulen habfa (enido un (uncionamiento adecuado durante dos anos an 
la universidad, obteniendo un promedio de 9 an un currfculo varlado de materias. No obstante, 
ahora estaba a punto de reprobar las materias prevlas a la carrera de medidna, las cuales 
induian cursos sobre quimica organica y embriologla. El alumno se quejaba de que el material 
en sus cursos de ciencias nalurales estaban slmplemente mas alld de su entendimiento. Sin 
embargo, obtenfa calificaclones de 8 en historia y literatura. Con base en el deterioro de sus 
califlcaciones, el psiquialra sospechb que el estudiante podrfa sufrir de un dark) cerebral leve. 
Se solicits una valoracidn neuroldgica. 

Aquf no se revisarA toda la baterfa de pruebas, pero ciertos resultados servirdn para introducir 
el vfnculo entre lo obtenido por una prueba y la funcidn cerebral. Quizes el descubrimiento m^s 
imporlante fue que el alumno no pudo coplar adecuadamente el patrbn geomdtrico senclllo de 
una cruz (vdase ilustracidn). Otro dato sugerente era una enorme diferencla en control motor fino 
entre ambos lados de su cuerpo. Con un aparato eslandarizado de golpeteo con los dedos, el 
neuropsicdlogo establecid que el estudiante podia golpetear 56 veces en 10 segundos con su 
dedo indice derecho, pero sdlo lograba hacerto 42 veces con su dedo (ndice izquierdo (Morrison. 
Gregory y Paul, 1979). Finalmente, aunque su Cl total era de 122, el estudiante tuvoun desempe- 
no deficlenle en la Category Test (Prueba de Categorias), una medlda del razonamiento abs- 
tracto y de formacldn de conceptos que dlscrimina de manera adecuada entre personas con 
dafio cerebral y neuroldgicamente intactas (Reitan y Wolfson, 1993). 

Dibujo de la cruz griega: 



Golpeteo con los dedos: Derecho 56 Izquierdo 42 

Cl Total en el WAIS-R 122 Cl Verbal 133 Cl de Ejecucidn 105 

Prueba de categorias: 56 errores/208 

iEste estudiante tenia dano cerebral? De ser asi, ^cuAI era el sltio mAs probable en el que 
habia deterioro? c,CuAles sedan las implicaciones de esla aparente disfuncidn? Se regresadi al 
caso del estudiante reprobado de los cursos previos a la carrera de medicina aJ final de este 
tema. Hasta ahora, el lector poseerS el suflciente conocimiento acerca de las relaciones cerebro- 
conducta para comprender un andilisls neuropslcoldgico de los resultados de pruoba que se 
mostraron antes. 
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neuronas en sitios cercanos y distantes llamados 
sinapsis. Las comunicacioncs q ui'micas entrc si- 
napsis pucden ocurrir hasta mil veces por segun- 
do. Incluso si sc utiliza un estimado conservador 
dc I 000 sinapsis por ncurona. en teorfa, cl nd- 
mero de transmisiones neuronales que pueden 
ocurrir en s61o un segundo es un sorprendente 
10' 7 o 100 000 000 000 000 000 (cicn mil bi- 
llones). Por ello, no es sorprcsa que neurocicn- 
Ifficos serios como Sir John Eccles (quien 
recibid el Premio Nobel por su trabajo en neuro- 
psicologfa) recurran a la hipdrbole para descri- 
bir al cercbro como “sin reservas, la materia 
orgdnica mas altamente organizada y con ma¬ 
yor complejidaden el universo" (Eccles, 1973). 

A pesar de las dificultades para comprcn- 
der al cercbro, los ncurocientfficos han formu- 
lado algunas tcorfas rudimcntarias y parcialcs 
a parti r de las siguientes fuentes: 

1. Estudios conductuales sobre pacientes con 
lesiones cerebrales separadas. 

2. Observaciones clfnicas de los efectos de la 
cstimulacidn cldctrica en sitios selecciona- 
dos del ccrebro en pacientes epildpticos en 
estado de conciencia y que estdn a punto de 
atravesar por escisiones cerebrales tcrapdu- 
ticas. 

3. Estudios de laboratorio con pacientes epi- 
lepticos a quienes se les han desconectado 
quirurgicamcntc los hemisferios cerebrales 
para controlar las crisis. 

4. Estudios dc invcstigacidn con nuevas tdcni- 
cas de imagenologfa del cerebro que propor- 
cionan un andlisis en tiempo real de la 
actividad cerebral continua. 

En lo que rcsta de cste tema, se proporciona al 
lector un compendio de las relaciones cerebro- 
conducta que se han identificado a partir de 
estas fuentes. 

ORGANIZACI6N FUNOONAL 
DEL CEREBRO 

La organizacidn funcional del ccrebro humano 
es diffcil de comprender debido a que las es- 


tructuras importantes estdn entrclazadas y p| c . 
gadas unas sobre otras. Ademds, contiene un 
complicado sistema de cavemas llcnas de If. 
quido que se denominan ventrfculos. Aurtque 
comienzan en cl centro del cerebro, dstos tie- 
nen un sistema de canales que en ultima ins- 
tancia se extiende hacia fuera y envuel ve a todo 
el cercbro, y tambidn va hacia abajo a la mddu- 
la cspinal para acluar como amortiguador para 
las eslructuras extremadamente delicadas del 
Sistema Nervioso Central. 

Aunque la disposicidn espacial de las es- 
tructuras cerebrales es muy compleja (figura 
9-1) desde la perspectiva de las interconcxiones 
neuronales, las divisiones del cerebro son su- 
cesiones lineales de una a otra: metenedfa- 
lo, mesencdfalo y prosencdfalo. Estructu- 
ralmente, los centros cerebrales inferiores (en 
el rombencdfalo) son los que tienen la organi¬ 
zacidn mas simple, mientras los centros ccre- 
bralcs superiores (en el cerebro posterior) son 
grandes, elaborados y anatdmicamente com- 
pletos. La organizacidn funcional sigue tambien 
este patrdn: los centros cerebrales antcriores 
median las funciones primitivas mds simples, 
como la respiracidn, mientras los centros cere¬ 
brates posteriores gobiernan funciones mds com- 
plejas y superiores. como cl pensamiento y la 
percepcidn. 

En el ccrebro complctamente dcsarrollado, 
cada divisidn consta de varias eslructuras im¬ 
portantes (cuadro 9-1). En lo que resta de esta 
unidad se revisa la funcidn y disfuncidn de es- 
los componentes estructurales principales del 
cerebro humano. 


M METENCEFALO 


La parte mds inferior del cerebro es el meten- 
cdfalo y su scccidn mds baja es el bulbo raquf- 
deo. Todas las flbras nerviosas que provienen 
de las partes superiores del ccrebro atraviesan 
la mddula osea en camino a la mddula espinal. 
El entrccruzamiento de estas Libras explica por 
qu£ las dos mitades del cerebro terminan con- 
trolando lados opuestos del cuerpo. La mddula 
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Cuerpo 

calloso 



Flgura 9-1. Perspecliva media del hemisferio cerebral derecho que muestra imporlanles estrucluras en el 
prosencbfalo, rnosencelalo y metencelalo. 


6sea media varias funciones corporales esen- 
ciales: respiracidn, deglucidn, vdmito, presidn 
sangufnca y, en parte, frecuencia cardiaca 
(Kandel, Schwartz y Jesseli, 1995). Tambidn 
se gobiernan aquf ciertos aspectos del habla y 
el canto, aunque sitios ccrcbrales superiores 
tambidn partici pan en estas funciones. 

Por lo general, el dafto importante a la md- 
dula 6sea resulla mortal. En casos aislados, una 
pequena embolia en la mddula 6sea causa uno 
o mils de los siguientes sfntomas: paralisis del 
lado opuesto, pdrdida partial de la sensacidn al 
dolor y tempcratura, torpeza, mareo, paralisis 
del mismo lado y atrofia de la lengua, y pdrdida 
partial del reflejo nauscoso. El virus de la polio 
—tan predominante en el deccnio de 1950, pero 
que no se ha controlado totalmenle— puede ata- 
car la mddula y provocar la suspensidn del con¬ 
trol neuronal para la respirecidn, lo cual hacc 
que se requiera de un rcspirador mecanico. 

La formacion reticular, una red de cuer- 
pos y fibres neuronales ascendentes y dcsccn- 
dentes, comienza en la mddula espinal y se 
extiende a travds de la mddula 6sea en camino 
hasta el t&lamo. Nuclcos especfficos dentro de 


la formacidn reticular se proyectan a amplias 
dreas del cerebro y, por tanto, ayudan a mediar 
reflejos posturales complejos y tono muscular. 
Con base en los estudios de Moruzzi y Magoun 
(1949) que demuestren que los tractos nervio- 
sos ascendentes dentro de la formacidn re¬ 
ticular gobiernan la excitacidn general o estado 
de conciencia, partes de esta estructura tambidn 
se conocen como sistema reticular activador. 
El daho a este sistema da lugar a la dismi- 
nucidn global de la conciencia que va desdc 
adormccimiento crdnico hasta estupor y coma 
(Carpenter, 1991). 

La protuberancia anular y el ccrebelo son 
las estrucluras m5s altas en el metencdfalo. Jun¬ 
tos ayudan a coordinar tono muscular, posture 
y movimientos oculares y manuales. Las lesio- 
nes a esta protuberancia pueden impedir que el 
individuo realice movimientos laterales coor- 
dinados con los ojos. Por tal razbn, es comun 
que los neurdlogos pidan a sus pacientes que 
demuestren movimientos oculares de izquier- 
da a derccha y de arriba hacia abajo. 

Aunque muchos sitios cerebrales partici- 
pan en el control motor, el ccrebelo desempeha 
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Cuadro 9-1. Divisiones del cerebro 
humano 


Prosencefalo 
Telencefalo 
(cerebro terminal) 


Diencdfalo 
(cerebro intermedio) 


Mesencefalo 

Mesencefalo 
(cerebro medio) 


Metencdfalo 
Metencefalo 
(cerebro de 
Interseccidn) 
Mielencefalo 
(cerebro espinai) 


Corteza cerebral 
Cuerpo calloso 
Ganglios basales 
Putamen 
Globo p^lido 
Nucleo caudado 
Amfgdala 
Lobulo Ifmbico 
Hipocampo 
Tabique 

Circunvolucion cin- 
gulada 

Bulbos olfatorios 
TAIamo 
Hipot£lamo 
GlSndula pineal 


Tectum 

Cotlculos superiores 
Coliculos inferiores 
Tegmento 
Nervios craneales 

Cerebelo 

Protuberancia anular 
Formacidn reticular* 
M6dula 6sea 


* La forma c«ln reticular comlenza en el tetencfttalo y se extends 
hacia arnba al dlencrifalo 


las medidas dc vclocidad de golpcteo con los 
dcdos (Rcitan y Wolfson, 1993) son un compo- 
ncnte importante de las baterfas dc prucbas 
neuropsicoldgicas. 

Los movimientos corporales puedcn perdcr 
su coordination cuando se dafla el cerebelo, 
volviOndose espasmddicos y temblorosos. In- 
cluso un simple ademdn como tratar de alcanzar 
una taza pucde terminar en arrojar inadvertida- 
mente dsta y su contcnido al otro lado de la 
habitacidn. La caracterfstica marcha irregular 
que se cncuentra en muchos individuos alco- 
hdlicos crdnicos —denominada ataxia— es una 
consecuencia de la degeneration del cerebelo 
(Ghez, 1991). Otro sfntoma del dano al cere- 
bclo es el temblor de intencidn, llamado asf 
porque no estd presente en reposo, si no que 
surge durante los movimientos voluntarios. 
intcncionales, de las manos. El nistagmo (am- 
bidn es comun en la cnfermedad del cerebelo. 
En este sintoma, los ojos parecen moverse de 
un lado a otro incluso cuando el individuo in¬ 
terna mantener la mirada fija. 

Junto con el centro vestibular en el oi'do 
interno, el cerebelo tambidn ayuda a coordinar 
el rcflejo vestibulocular (RVO). cl cual actua 
para mantener los ojos en un lugar fijo cuando 
se gira la cabeza. Sin el RVO. la visidn seria 
increfblcmenie borrosa cuando se movicra la 
cabcza inclusive una fraccidn dc un ccntfmc- 
tro. En vez de ello, una pequena drea del cere¬ 
belo coordina la fijacidn rapida de los ojos para 
compensar los movimientos de la cabcza. 


v j MESENCEFALO 


una importante funcidn. £ste recibe informa- 
cidn sensorial dc todas las partes del cuerpo y 
coordina los dctalles de los movimientos auto- 
maticos hdbiles. El dano al cerebelo puede pro- 
ducir una variedad de trastornos motores, 
dependiendo de los silios cspcciTicos afccta- 
dos (Bradshaw y Mattingley, 1995). Los muscu- 
los pueden volverse fldcidos y cansarse con 
facilidad. Puede rcsultar diffcil el golpeleo r£- 
pido, coordinado, del dedo fndice. Por tanto, 


El mesencefalo consiste en dos divisiones prin- 
cipales que cubren un acucducto lleno dc lfqui- 
do. El tectum o (echo se cncuentra por encima 
del acueducto, y el tegmento o piso se en- 
cuentra por debajo de 6ste. El tectum consta, 
principalmente, de dos conjuntos de nuclcos 
bilateralmente simdtricos, los colfculos supe¬ 
riores y los colfculos inferiores. Los primeros 
median los movimientos de cabeza y ojos que 
sc utilizan para localizar y seguir estfmulos 
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visuales. Los colfculos infcriores proporcionan 
In misma funcidn para los estimulos audiiivos. 

El tcgmcnto cs una estacidn de rclevo para 
|as fibras sensorialcs y motoras y tambien con- 
tienc los nucleos de muchos de los nervios 
cranenles (algunos de los cuales lambien par- 
ien del metencdfalo). Los 12 pares crnnealcs 
son los principales haces ncuronales cuyas fun- 
ciones son bien especfficas y pueden exarni- 
narse con fucilidad. Algunos son exclusivamentc 
sensoriales y envfan informacion del mundo 
exterior al cerebro; algunos son sdlo motores y 
sirven para ejecutar las drdenes de dste; ccrca 
de tin tercio de los pares craneales poseen tanto 
funciones sensoriales como motoras. Los neu- 
rdlogos sc rcficrcn a ellos por numeros, que 
corresponden aproximadamente a la secuencia 
de arriba hacia abajo en que surgen a pnrtir del 
cerebro (cuadro 9-2). El lector observard que 
muchos de los pares craneales median aspec- 
tos de visidn y movimiento ocular, funciones 
sensoriales bdsicas y movimiento de mandfbu- 


Cuadro 9-2. Pares de nervios craneales 
y sus funciones 


1. Olfatorio 

Sentido del ollato 

2. 6ptico 

Visidn 

3. Oculomotor 

Movimientos horizon¬ 
tal y vertical del ojo 

4. Paldlico 

Movimiento vertical 
del ojo 

5. Trigdmino 

Sensacidn facial, movi¬ 
miento de la mandibula 

6. Motor ocular 

Movimienlo horizontal 

extorno 

del ojo 

7. Facial 

Movimiento facial y 
gusto 

8. Auditivo/ves- 

tibular 

Ofdo y equilibrio 

9. Glosofaringeo 

Gusto, deglucidn 

lO.Vago 

Reflejos viscerates 

11. Aocesorio 

Movimiento de la ca- 
beza 

12. Hipogloso 

Movimiento de la len¬ 
gua 


la, lengua, rostra y cabcza. A traves de los si- 
glos, los ncurdlogos han disenado una varic- 
dad de tdcnicas confrontativas simples para 
evaluar los pares craneales. Por peculiar que 
pueda parecer, pedirlc al paciente que saque la 
lengua y la mueva a la izquierda, dcrccha, arri¬ 
ba y abajo, puede proporcionar infomnacidn im- 
portante acerca del funcionamiento del par 
craneal hipogloso (doceavo par). De igual mane- 
ra, varias pntebas sencillas de audicidn, cquili- 
brio, movimiento ocular y demas se utilizan para 
llcvar a cabo el examen de los pares craneales. 

Aunque los neuropsicdlogos tienen algu¬ 
nas hemimientas y proccdimicntos adecuados 
para la evaluacidn de la disfuncidn del meten- 
cdfalo y mcscncdfalo, son los especialistas me¬ 
dicos, en particular los neurdlogos, quienes por 
lo regular diagnostican y tratan las discapaci- 
dades relacionadas con estos sitios cerebrates. 
Las pruebas y procedimientos neuropsicold- 
gicos se concibieron principalmente para la 
evaluacidn de la funcidn y disfuncidn en cl 
prosenclfalo. Por tanto, se dcdica la mayor 
parte de cstc trabajo a las estructuras de esta par¬ 
te del cerebro. El proscncdfalo consta del 
diencdfalo, un conjunto dc estructuras meno- 
res —que el pufio— que se encuentran aproxi¬ 
madamente en el centra del cerebro, y el 
telencdfalo, un grupo mas grande de eslructu- 
ras cerebrates que estdn colocadas por cncima 
del diencdfalo (cuadro 9-1). 

DIENCEFALO 

Las estructuras del diencdfalo incluycn ttilamo, 
hipotalamo y giandula pineal. Esta ultima es 
una estructura del tamatio dc un guisantc que 
se encucntra en cl centra del cerebro, y se sabe 
que secreta la hormona melatonina con un rit- 
mo biologico cfclico, pero su funcidn exacta se 
desconoce (Crapo, 1985), por lo que los lextos 
contempordneos de neurociencias casi la igno- 
ran. Desde la perspectiva dc la neuropsicolo- 
gfa, el t£lamo y cl hipoUilamo son mucha mis 
importantes. 

El t£lamo es una pequena estructura 
bifurcada en la base del cerebro. No sc puede 
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exagerar su imporiancia: es la estmctura clave 
quc proporciona informaci6n y datos sensoria- 
les a la corteza cerebral accrca del movimiento 
conlinuo. De hecho, toda la informacidn sen¬ 
sorial, exccpto la olfaiona (el senlido del olla- 
to), sc envfa primero al (alamo y despuds se 
proyccta a regiones espccfficas de la corteza 
cerebral a travds de haccs neuronales conoci- 
dos en conjunto como radiacioncs talamocor- 
(icalcs. Una lesidn amplia a un lado del tdlamo 
causa alteration grave de todas las formas dc 
sensibilidad en cl lado opucsto del cucrpo. Las 
lesioncs mds pequefias pueden producir que se 
eleve el umbnil al dolor; ademds, los cstfmulos 
dolorosos pueden causar una respuesta exage- 
rada. Con las lesiones al tdlamo puedc disminuirdc 
manera notable la percepcidn de la postura y 
dc los movimientos pasivos (Carpenter, 1991). 

El tdlamo cs mucho mds quc una estacidn 
de relcvo; tambidn representa una funcidn im- 
portante en la integracidn de los sistemas 
neuronales pues contribuyc a la memoria, aten- 
cidn, habla y experiencia cmocional (Kandcl, 
Schwartz y Jesscll, 1995). Carpenter (1991) 
afirma que el tdlamo es la clave para compren- 
der la operacidn de la corteza cerebral. 

El hipotdlamo es una eslructura engaflo- 
samente pcquefta que se encuentra justo por 
debajo y al frenie del tdlamo. Aunque constitu- 
ye sdlo cerca de 0.3% del peso del cercbro, par- 
ticipa en numcrosos aspectos de la conducta 
motivada y de la regulacidn del cuerpo: alimen¬ 
tation. conducta sexual, suefto. regulacidn de 
temperatura, conducta cmocional y movimien¬ 
to. Bien estudiadas en animales inferiores. las 
funciones del hipotdlamo se conoccn menos en 
los humanos (Kolb y Whishaw. 1990). Se sabe 
que ejerce dominio sobre la gldndula hipofi- 
saria, con lo cual modula una gran variedad de 
funciones cndocrinas. La causa mds comun 
dc lesidn al hipotdlamo es un traumatismo grave 
en la cabcza. Las lesioncs hipotaldmicas condu- 
cen con frecuencia a alleraciones de la funcidn 
de la hipdfisis, incluycndo ingestidn excesiva 
o deficiente de alimento o agua y problemas 
con la regulacidn de temperatura y presidn san- 
gufnea (Kupfcrmann, 1991a). 

La formacidn mds externa del prosencdfalo 
es el telcncdfalo, una estructura mucho mayor 


que el diencdfalo. Las pruebas neuropsicoldgj. 
cas son particularmente adecuadas pant detectar 
la disfuncidn en el telencefalo. A continuacidn 
se presentan analisis independientes de las si- 
guientes cstructuras tclencefdlicas: lobulo lint- 
bico, ganglios basales, cucrpo calloso y corteza 
cerebral. Por favor, veasc quc cs inevitable cier- 
to grado de simplificacidn excesiva cuando se 
cstudian las funciones cerebrales. Se recuerda 
al lector que el cerebro tiene abundantes inter- 
conexiones con sistemas funcionalcs complcjos 
y mal comprendidos. Los sitios cerebrales in- 
dividuales pocas vcccs acluan en aislamiento. 


l6bulo umbico 

El lobulo Ifmbico incluyc al hipocampo, tabi- 
que y circunvolucidn cingulada. Estas estruc- 
turas revisten la pared interna de la corteza 
cerebral. El Idbulo Ifmbico suele conocerse 
como sistema Ifmbico, lo cual con toda proba- 
bilidad cs una denominacidn incorrecta basa- 
da en espcculaciones anteriores que ahora se 
saben incomplctas. En particular, Papez(1937) 
propuso quc las eslructuras del Idbulo Ifmbico 
constituycn un circuito neuronal continuo, 
rcsponsablc de la emocidn y control de la acti- 
vidad visceral —de aquf la referencia a sistema 
Ifmbico. Esta pcrspcctiva ha resultado de- 
masiado simplista, pero la atractiva referencia 
a un sistema funcional aun continua. Ahora pa- 
rece claro que las estnicturas independientes del 
l6bulo Ifmbico pueden tener muchas funciones 
diferentes, incluycndo una actividad primordial 
en la regulacidn de la emocidn (Kupfermann, 
1991a). 

Sc sabe que una estructura lfmbica, el hipo¬ 
campo, representa un papcl especial en la me¬ 
moria. Los humanos posecn dos hipocampos 
(uno en cada Idbulo temporal) que son parte dc 
un circuito complcjo y mal definido de memo¬ 
ria quc consolida las experiences nuevas en 
recuerdos a largo plazo (Mishkin y Appenzellcr. 
1987). El dano a un hipocampo puedc producir 
deficiencias leves en la memoria; no obstante, 
las personas que han sufrido dano en ambos 
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Itipocampos o que se los han retirado quirurgi- 
ca nientc, cxpcrimenlan incapacidad para rccor- 
jur cualquier cosa nueva por mas dc pocos 
icgundos (Milner, Corkin y Teubcr, 1968). Es- 
los desafortunados individuos conservan los 
fccuerdos a largo plazo adquiridos antes dc la 
destruccidn bilateral de los hipocampos, pero 
no pucdcn convcrtir los rceucrdos nucvos a 
corto plazo en mcmorias a largo plazo; dichas 
personas podrfan leer la misma revista una y 
otra vez y saludar al doctor cada d/a como si 
ftcra un desconocido. La mlcligcncia general 
se afecla poco; sin embargo, debido a su me- 
moria deficiente, estos pacienles requicren dc 
mancra invariable institucionalizacidn o un alto 
grado dc supervisi6n. 

La destruccion unilateral del hipocampo 
causa alteraciones en la memoria selectiva que 
secorrelacionan con especializaciones hemisfd- 
ricas bien conocidas (funciones verbales en el 
hemisferio izquierdo, funciones espaciales en 
el hemisferio derecho. las cualcs se analizaran 
posteriormente). La pdrdida del hipocampo 
izquierdo altera la memoria verbal, mientras 
la dcstruccidn del hipocampo derecho afecta la 
memoria pictdrica y auditiva, en particular con 
patrones visuales y auditivos que no pucdcn 
clasificarse con facilidad (Smith y Milner, 
1981). En contraste con las perturbaciones de 
memoria producidas por el dafio bilateral al 
hipocampo que son profundus y de larga dura- 
cidn, los trastornos de memoria causados por 
el dano unilateral tienden a ser transitorios y 
sutiles. Sc requicren pmebas neuropsicologicas 
complejas para su deteccidn (Rausch, 1985). 


GANGUOS BASALES 


Los ganglios basales consisten en un conjunto 
de nucleos en el proscncdfalo que se conectan 
con la corteza cerebral airiba y el tdlamo abajo; 
Iradicionalmente se ha considcrado que son 
parte del sistema motor, sus partes principals 
son tres grandcs nucleos subcorticalcs: caudado, 
putamen y globo pdlido; algunas autoridades 
tainbidn consideran que la am/gdala cs parte dc 


los ganglios basales (Carpenter, 1991). Estas 
estmeturas estiin intcrconectadas y sc rclacio- 
nun funcionalmcnte con cl nuclco subtalamico 
y la sustancia negra. Junto con el ccrcbclo, el 
sistema corticoespinal y los nucleos motores 
del tallo cerebral, los ganglios basales partici- 
pan en cl control de movimientos. A difercncia 
de otros componcntcs del sistema motor, estos 
ullimos no ticncn concxiones dircctas con la 
mddula espinal, y sus funciones moloras son 
indirectas y sc median a travds de conexiones 
neuronales con la corteza cerebral frontal. 

El s/ndrome mils comun producido por cl 
dafio a los ganglios basales es cl mal dc Par¬ 
kinson (Cote y Crutcher, 1991), en el que se 
observan tres tipos caracterfsticos de trastornos 
motores: movimiento involuntario, incluyendo 
temblor; pobreza y lentitud de movimiento, sin 
pardlisis; y cambios en postura y tono muscular. 
En sus ultimas etapas, esta enfermedad se de- 
nota por una expresidn facial inmdvil, similar a 
una mascara, dificultad extrema para iniciar mo¬ 
vimientos y temblor fino que puedc desaparcccr 
una vez que cl movimiento sc ha iniciado. 

Los pacienles con mal de Parkinson tam- 
bidn presentan deficiencias cognitivas espeef- 
ficas, lo cual sugierc que los ganglios basales 
no s61o contribuycn al movimiento, sino tam- 
bidn al pensamiento. Las deficiencias observa- 
das incluyen disminucidn en la flexibilidad 
cognitiva y una levc rcduccion en aprendizaje 
y rcmemoracidn (Koss, 1994); tambidn sc pre- 
senta pdrdida dc la cspontancidad y falta de ini- 
ciativa (La Rue. 1992). 

CUERPO CALLOSO 


El cuerpo cnlloso es la principal comisura que 
sirve para integrar las funciones de los dos he- 
misferios cerebrales. Este gran haz de fibras 
nerviosas subcorticales tiene aproximadamen- 
te 10 cm de longitud y menos de I cm de gro- 
sor. El cuerpo calloso abarca cl cerebro de un 
lado a otro, justo por cncima del nivel del t/ila- 
mo; aunque existen excepcioncs, sucle conectar 
sitios cerebrales homdlogos en los hemisferias 
izquierdo y derecho. 
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Su funcidn sc habfa comprcndido mal hasta 
cl dcccnio de 1960, cuando Sperry, Gazzaniga 
y otros investigadorcs iniciaron complejos 
csludios dc laboratono con los llamados pacicn- 
tes con cscisidn hcmisfdrica (Sperry. 1964; 
Gazzaniga, 1970; Gazzaniga y LcDoux, 1978). 
Estos pacicntes eran personas con epilepsia a 
quicnes se les habfa escindido el cuerpo callo- 
so para evitar cl transporte de las descargas 
cpilcpticas de un hemisferio al olro. Aunque 
exteriormente pareefan normales, estos indivi- 
duos re vc I aba n un sorprendenle aislamicnto de 
la conciencia cuando la informacidn visual sc 
restringfa a un hemisferio o al otro. Por ejem- 
plo, cuando se presentaba a travds dc un taqui- 
toscopio, la imagen dc una manzana al lado 
izquierdo del punto dc fijacidn de la persona 
examinada, el estfmulo se procesaba sdlo en cl 
hemisferio derccho (debido al cruzamicnto nor¬ 
mal de las fibres nerviosas). Adenitis, debido a 
que se habfa cortado cl cucrpo calloso, la ima¬ 
gen dc la manzana permaneefa atrapada en cl 
hemisferio derecho. Como el lecior descubrird 
despuds, en general cl hemisferio derecho es 
mudo y no cumplc con funciones importantes 
del lenguaje. De modo que cuando se les 
preguntaba a los examinandos “iQud vio lis¬ 
ted?" quiencs respondfan desde el hemisferio 
izquierdo verbal deefan honcstamentc “nada". 
No obstante, estos pacientes podfan identificar 
con facilidad el objeto sehaltindolo con la mano 
izquierda (que estd bajoel control neuronal del 
hemisferio derecho). Esto sugicrc que aunque 
cl hemisferio derecho no puedc hablar, tiene 
una capacidad separada c independiente para 
percibir, aprender, recordar y expedir drdcncs 
para tarcas motoras. 

En un indi viduo sano con cl cuerpo calloso 
intacto, la conciencia parece ser unitaria por- 
que las dos mitades del cerebro se pueden co- 
municar y formar un convenio en cuanto a 
pcrccpcidn, pensamiento y accidn. Gran parte 
del conocimicnto que se tiene acerca de las es- 
pecializacioncs hcmisfdricas, que se analizardn 
despuds, se ha logrado a partir del estudio deta- 
Uado de los pacientes con escisidn hemisfdrica. 
Se ha obtenido mayor discemimiento a partir 
dc cstudios sobre personas afcctadas por la au- 


sencia congenita de esta estructura, padeci- 
miento que se conoce como agdncsis del cuer¬ 
po calloso. Por lo general, estos pacientes tienco 
una variedad dc dcfcctos intelcctuales, lo que 
indica que el cuerpo calloso facilila cl aprendi- 
zaje en muchas esferas cognitivas diferentes 
(Bradshaw y Maltinglcy, 1995). 

M CORTEZA CEREBRAL 


La corteza cerebral, la capa miSs exterior del 
cerebro, es la fuente de los nivcles mds eleva- 
dos de procesamiento sensorial, motor y cog- 
nitivo. Tambidn llarnada neocorteza, la corteza 
cerebral cs un dcsarrollo evolutivo muy recien- 
te. Es la capacidad funcional de estc sistema 
cerebral —con una profundidad uniforme de 
scis capas— la que divide de manera m<is tras- 
cendcntal a los humanos de los animates infe- 
riores. 

El tejido de la corteza cerebral se encucn- 
Ira plcgado en elaboradas circunvolucioncs que 
consisten en protuberancias y canales. Las pro- 
tuberancias prominentes se denominan circuit- 
volucioncs, mientras las hendiduras, fisuras y 
canales, cisuras. Esta disposicidn permite que 
el cerebro tenga una cantidad mucho mayor de 
corteza cerebral que si la supcrficic fuera lisa. 
Aunque cl palrdn dc circunvoluciones y cisu¬ 
ras es sutilmentc unico para cada persona, en 
un cerebro normal siempre pueden disccmirse 
ciertos hitos principalcs, como la cisura central 
y la cisura lateral (figure 9-2). 

Una pequena porcidn de la corteza cere¬ 
bral cs la corteza compromctida. Estos sitios sc 
dcdican al procesamiento sensorial b&sico de 
la visidn, audicidn, tacto y control motor. No 
obstante, la especificidad de la corteza compro- 
melida es relativa, no absolute. Por ejemplo, la 
circunvolucidn precentral se considera como 
la franja motora, sin embargo sdlo 40% de las 
ediulas motoras primarins que ejecutan los mo- 
vimientos voluntarios se localizan aquf, otro 10 
a 20%, en la franja sensorial, y 40 a 50% en 
sitios cerebralcs adyacentes (Brodal, 1981). Lo 
que es mas, la franja motora tambidn contiene 
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Figure 9-2. Principles hltos del hemisterlo cerebral izqulerdo. 


una proporcibn dc buen tamano dc cdlulas 
scnsoriales. Asf, las cdlulas quc satisfaccn fun- 
cioncs scnsoriales y motoras espccfficas sc 
encuentran altamcnte concentradas en el area 
compromeiida respectiva, pero tambidn se van 
reduciendo y sobreponiendo con sitios cercbra- 
Ics ccrcanos. 

La mayor parte de la corteza cerebral cs 
corteza no compromctida o dc asociacibn. Es- 
tos sitios participun en cl anblisis dc informa- 
cibn sensorial y formulacibn de respucstas 
motoras. Es la proporcibn rclalivamcnte gran¬ 
de dc corteza dc asociacibn lo que distingue al 
homo sapiens de las animales inferiores. El 
pensamiento abstracto, la crcatividad y la so- 
lucibn dc problentas se encuentran, en gran 
medida, inscritas bajo estas adaptacioncs evo- 
lutivas del ccrebro humano. 

Benson (1994) subdivide la corteza de aso- 
ciacion en tres tipos: unimodal, hctcromodal y 
supra modal. Las dreas uni modules de asociacidn 
se dedican a una sola modalidad (visitin, audi- 
cidn, somestesia o movimiento) y se localizan 
adyacentcs a las areas corticalcs comprometi- 
das. Dentro de cada area unimodal de asocia- 
cibn, los cstimulos que ingresan se categorizan 
y comparan con la informacibn previa. El daiio 
a las areas unimodales tiende a causar dificulta- 


dcs en la discriminacibn y categorizacibn de 
los estfmulos que ingresan dentro de esa mo¬ 
dalidad. Por ejemplo, una lesibn en el brea 
unimodal visual dejard intacta la visibn, pero 
alterard el reconocimiento y discriminacibn de 
estfmulos visualcs. Sc han disenado diferentes 
pruebas que implican figuras supcrpucstas para 
evaluar el dctcrioro de cstc lipo. Por ejemplo, 
una persona con dano al drea unimodal de 
asociacibn visual Serb incapaz de reconocer 
las formas individualcs en la figura 9-3. Las 
areas heteromodales de asociacibn poseen co- 
nexiones neuronales que viajan entre modalida- 
des. En estas dreas se entrcmezcla y procesa la 
informacibn transmodal en la que participan 
modulidadcs sensoriales (visibn, audicibn, tac- 
to). El dano a la corteza hcteromodal de asocia¬ 
cibn puedc causar una variedad de sfndromes 
muy conocidos como la afasia, la cual se anali- 
zard despuds. Por ultimo, la corteza supramodal 
de asociacibn. localizada exclusivamente en el 
drea frontal, cs rcsponsable del control de la 
cognicibn de alto nivel a travds dc un proceso 
de seleccibn y. en especial, de inhibicibn. Esta 
corteza es la mds reciente en sentido filo- 
gendtico, y ejerce control ejecutivo sobre otras 
funcioncs ccrebralcs. El dark) a esta drea del 
cerebro puedc causar deterioro en el control dc 









374 • Evaluation psicoldgica: Historla, principios y aplicationes 


(Capilulo 9) 


$ 





Figure 9-3. Ejomplos do figures superpueslas pare la 
evaluaciOn do la disfuncfon visoperceptual. 

Fuente: Reproducido con autorlzacidn do Gregory. R. 
J. (1987). Adult Intellectual assessment. Boston, MA: 
AJIyn & Bacon. 


impulsos, en la planificacidn y de otras funcio- 
nc.s cjcculivas. 

En lo que rcsta de esta seccidn, sc cxami- 
narrin das aspectos dc la funcidn cerebral que 
ocuircn dentro de la corteza cerebral: 1) locali- 
zacidn dc la funcidn dentro de los cuatro Idbu- 
los principalcs dc cada hemisferio cerebral y 
2) lateralizacidn de la funcidn dentro de los 
hemisferios cerebrales izquierdo y derecho, con 
atcncidn especial a las funcioncs de lenguaje 
del hemisferio izquierdo. Tambidn se introdu- 
cirti al lector a las tdcnicas de imagenologia 
del ccrebro y otras pruebas clinicas dc la dis- 
funcidn cerebral, debido a que. con frecuencia, 
su utilizacidn va de la mano con la valoracidn 
neuropsicologica. Estc andlisis se disend para 
ayudar al lector a comprender la naturalcza y 
propdsito de las pruebas ncuropsicoldgicas que 
sc analizardn en el siguiente tema. 


FUNCIONES DE LOS LOBULOS 
CEREBRALES 


El encdfalo se conforma de la corteza cerebral 
y las cstructuras subyacentcs del tclcncdfalo. 
Una cisura media dc gran tamano que se ex- 
tiende de la parte frontal a la trascra divide al 
cncdfalo en dos cstructuras aproximadamente 
simctricas conocidas como hemisferio cerebral 
izquierdo y hemisferio cerebral derecho. En 
general, la corteza dc cada hemisferio rccibe 
informacidn sensorial y envfa informacidn mo- 
tora al lado opuesto o contralateral del cucrpo. 
Estc principio de regulacidn contralateral licne 
sdlo una cxcepcidn real, cl senlido del olfato. 
La estimulacidn olfaloria en cada fosa nasal se 
proccsa directamente en cl bulbo olfatorio del 
mismo lado que se cncucnlra justo por encima 
dc la cavidad nasal. Tambidn sc debe mencio- 
nar que la regulacidn contralateral dc la visidn 
cs compleja: cada mitad del campo visual se 
procesa en el hemisferio cerebral opuesto. Lo 
que es rods. la regulacidn contralateral es rela- 
tiva. no absoluta. Por cjemplo, las conexioncs 
ncuronalcs del ofdo derecho se exlienden prin- 
cipalmcnte al hemisferio izquierdo, pero tam- 
bidn existen algunas proyecciones hacia el 
mismo lado o ipsolaterales. 

Dentro dc cada hemisferio cerebral pueden 
utilizarse varios hitos prominentes para demar- 
car cuatro ldbulos principalcs. El Idbulo occi¬ 
pital se localizn en la parte trasera del ccrebro, 
delr&s dc la cisura parictoccipilal; el Idbulo 
parietal sc encuentra detrds de la cisura cen¬ 
tral; el Idbulo temporal csld debajo de la cisura 
lateral y el Idbulo frontal sc encuentra al frentc 
de la cisura central. Los Ifmites occipitoparie- 
tales y occipitotemporales son un tanto indis- 
lintos (figura 9-2). 

Los ldbulos del mismo nombre en ambos 
lados del ccrebro son aproximadamente sirnd- 
tricos en estructura y tambidn comparten mu- 
chas funciones. Por el momento, se enfatizardn 
las semejanzas opcrativas de las dos mitadcs del 
cerebro a medida que se revisen las funciones 
dc los cuatro ldbulos. No obstante, debe adver- 
tirsc al lector que los hemisferios cerebrales 
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izquierdo y derecho tambidn poseen funciones 
especial izadas quc se anulizaran despuds. Ade- 
m as, cs frccucnte que estas espccializacioncs 
hemisfdricas se corrclacioncn de manera sensi¬ 
ble con variaeioncs estructurales. Por ejemplo, 
ciertas estructuras hemisfdricas son mas grandes 
c n el lado izquierdo del cerebro, lo cual revela 
la latcralizacibn de las funciones del lenguaje a 
esie hemisferio. 

l6bulos occipitales 

Las principales Areas sensoriales para la visibn 
sc localizan en los lobulos occipitulcs; gran 
paric de esta area dc proycccibn sc cncucntra 
cn la superficie mesial o media quc separa los 
dos hemisferios cerebrales. Cada Ibbulo occi¬ 
pital vc cl lado opuestodel mundo visual. Asf, 
todos los estfmulos visualcs del lado izquierdo 
del punto de fijacibn del lector se procesan en 
ultima instancia en el Ibbulo occipital derecho 
y viccversa. El mundo visual dividido sc com- 
partc a travds del csplenio, la porcibn trascra 
del cuerpo calloso. Io cual produce una percep- 
cibn unificada del campo visual complete. El 
dano al Area visual principal produce una pbr- 
dida correspondicntc del campo visual del lado 
opuesto. Por ejemplo. una lesibn amplia en el 
!6bulo occipital izquierdo harfa que una perso¬ 
na fucra cicga del lado derecho. Una lesibn muy 
pequena podria producir un escotoma o punto 
ciego. 

Un examen minucioso del campo visual es 
importantc para una valoracibn neuropsicolb- 
gica completa. Con base en cl patrbn de perdi- 
da del campo visual, unexaminadorcompctcntc 
puede inferir la localizacibn y grado del dano 
cerebral. El sistemn visual puede compararse 
con cables de transmisibn quc atraviesan el ce¬ 
rebro desdc los ojos al frente hasta los Ibbulos 
occipitales atrds. En particular hacia el area tra- 
sera del cerebro, los cables irradian al exterior 
para ocupar porciones importantes de tejido 
subcortical. Las lestones subcorticales en la 
parte trascra del cerebro tienen buena posibili- 
dad de allcrar o danar las redes de transmisibn 
neuronal. Este dano conduce a una pbrdida del 


campo visual asociado (figura 9—4). El patrbn 
de pbrdida del campo visual cs clave directa del 
sitio del dano dentro de los Ibbulos occipitales 
y tejido circunvecino. 

La porcibn frontal de cada l6bulo occipital 
es corteza unimodal de asociacibn. Estas regio- 
ncs sintetizan los cstimulos visuales y obtienen 
signiftcados dc ellos. Aquf cs dondc ocurre el 
proccsamicnto de alto nivel de la informacibn 
visual. El dano a la corteza dc asociacibn de 
los Ibbulos occipitales puede provocar agnosia 
visual, una dificultad en el rcconocimiento de 
dibujos, objetos o rostros (Kandcl, 1991). Luria 
(1973) describib el caso tlpico de un pacicntc 
con una lesibn dc esc tipo: 

El paciente examine cuWadosamente el dlbu|o 
de un par de anteojos que se le muestra. Esta 
confurtdldo y no sabe lo que represen la. Comlen- 
za a adivinar. “Hay un clrculo... y otro clrculo .. y 
una barra... una barra cruzada... ya veo £debe 
sor una bicicleta? 

Las agnosias visuales se vinculan dc manera 
particular con lesiones en el lado derecho de la 
corteza occipital de asociacibn, pero tambien 
pueden implicar dano cn los Ibbulos parietal y 
temporal. Una forma particularmcntc dcstaca- 
da dc agnosia visual es la prosopagnosia, la in- 
capacidad para rcconocer rostros familiares. 
Benson (1994) cita un ejemplo de un hombre 
de 70 afios de edad que liabi'a sufrido una scrie dc 
embolias que afcctaban las porciones delantc- 
ras dc los Ibbulos occipitales. La dolcncia prin¬ 
cipal del paciente era quc no podfa reconoccr a 
su esposa y a su hija al verlas, aunque las iden- 
tificaba de inmediato por sus voces. En otro 
caso de agnosia visual, conocida como agnosia 
de objeto, un paciente reprodujo con gran ha- 
bilidad el dibujo de un Iren, pero no lenfa idea 
dc qud habia dibujado. Benson (1988) descri¬ 
be los muchos sfntomas fascinantes dc la 
agnosia visual. 

L6BULOS parietales 

Kolb y Whishaw (1990) senalan que los Ibbu¬ 
los parietales son un artificio de la dcfinicibn 
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Flgura 9-4. Diagrama esquemdtico del ststema visual y de los efeclos do las lostones en dlversos slllos. 

Fuente: Adaplado con autorizacidn de Gregory, R, J. (1987). Adult intellectual assessment. Boston: Allyn & Bacon 


anatdmica cxagcrada; cs dccir, no rcflcjan uni- 
dad citoarquitcctdnica o fisioldgica. Por tauto, 
cs imposible una leorfa unitaria dc la funcidn 
del Idbulo parietal. Dc hccho, pueden identi- 
ftcarsc dos funcioncs i tide pend ionics dc los 
Idbulos parietnles. una que se ocupa princi- 
palmenle dc la franja somatosensorial localiza- 
daen la circunvolucidn posccntral y la otra que 
sc encarga primordialmente de las zonas trasc- 
ras o dc asociacidn dc los l6bulos parietales. 

La circunvoluci6n posccntral dc cada lobu- 
lo parietal media la conscicncia dc lo que succ- 
dc en la superficie contralateral del cuerpo. Este 
tejido, al que de modo apropiado sc Ic denomi- 
na franja somatosensorial (o somcstdsica), rc- 


cibc inl'ormacion sobre las scnsaciones del tac- 
to y posicidn dc los miembros (figura 9-2). La 
franja somatosensorial y la franja motora del 
Idbulo frontal se encuentran muy interrclacio- 
nadas por redes neuronales subcorticales; la 
organizacidn (6pica dc cstos sistemas funcio- 
nales entrelazados es muy similar. La cantidad 
de tejido somatosensorial que se dedica a cada 
lugar del cuerpo corresponde a la importancia 
funcional dc esa drea. Porcjcmplo, la realimen- 
(aci6n de los labios y lengua es csencial para el 
habla; la cantidad dc tejido somatosensorial 
que se dedica a estas cstrucluras cs rclativa- 
mente grande. El dano a la franja soma¬ 
tosensorial rcsulta en p^rdida dc la sensacidn 
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cn las partes eorrespondientes del cucrpo en el 
lado opuesto. 

La porcidn trasera de cada Idbulo parietal 
es corteza heteromodal dc asociacidn. Hsta firea 
parecc haberse especializado en la intcgracidn 
de informneidn sensorial dc regiones somdticas, 
visuales y auditivas cercanas. Un sintoma co- 
mun del dano a csta area cs la incapacidad para 
jeconocer objetos a travds del tacto, sintoma 
que se conocc como astereognosis. Muchas ba- 
terfas dc pruebas ncuropsicoldgicas incorporan 
mcdidas dc astereognosis, como cl reconoci- 
miento de monedas (1 centavo, 5 centavos, 10 
centavos) a travds del tacto. £sta es una tarca 
transmodal, cn la medida en que el paciente 
debc fonnar una reprcscntacidn visual basdn- 
dosc solo en el tacto. Esta regidn utiliza su in- 
formacidn poiimodal para proporcionar gufa 
visomotora a los miembros, manos y ojos 
(Clarke, 1994). 

El dano a la regidn parietal de asociacidn 
cn cualcsquicra dc los dos lados puede alternr 
la capacidad para cl dibujo. Esta es una forma 
de dispraxia dc construccidn que se analizard 
posteriormente. El dano a esta drea cn cl lado 
izquicrdo reduce la calidad del dibujo, como si 
la persona tuviera dificultad para lograr que la 
mano que realiza el dibujo vaya en direccidn 
corrccta. En contraste, el dano a esta drea en cl 
lado derccho rcsulta en ddficil perceptual. La 
persona (icnc problemas para integrar las partes 
individuates cn un todo consistente; se pierde 
la gestalt general del dibujo. Las dreas de aso¬ 
ciacidn dc los Idbulos parietalcs izquierdo y 
derccho (ambidn cumplen con varias funciones 
lateralizadas, las cuales sc analizardn despuds. 

l6bulos temporales 

Sc pueden identificar cuatro funciones basicas 
de los lobulos temporales (Kolb y Whishaw, 
1990; Bear, 1986): proccsamiento primariode 
sensacioncs auditivas, procesamiento secunda- 
rio de pcrcepciones auditivas, almaccnamiento 
de memoria a largo plazo y modulaci6n de im- 
pulsos bioldgicos (en especial agrcsidn. temor 
y sexualidad). Cada una dc cstas funciones se 
analizardn por separado. 


Cada l6bulo temporal conticne una cortcza 
auditiva primaria en su porcidn superior. Gran 
parte de la corteza auditiva estd insertada en la 
cisura lateral y no es visible desde una pcrspec- 
tiva lateral del cerebro. La corteza auditiva iz- 
quierda recibe informacidn sensorial que 
provicne principnlmcntc del oi'do derccho y vi¬ 
ce versa; sin embargo, existen tambidn algunas 
entradas sensorialcs del mismo lado. Una le- 
sion a la regidn auditiva primaria en un Idbulo 
temporal puede causar una vanedad de deficien- 
cias audiopcrccptualcs, incluyendo incapacidad 
para detectar sonidos breves, dctcrioro en la 
localizacidn dc los mismos y dificultad para 
discriminar los sonidos del habla. Estas deficien- 
cias son cspeciulmente probables cn el caso de da¬ 
fio cn la corteza auditiva izquierda, como se verd 
mils adclantc. En casos aislados, el dano a las 
dreas auditivas puede causar sordera, aunque 
el aparato auditivo estd intacto. 

La corteza auditiva unimodal dc asociacidn 
ocupa gran parte de la supcrficie externa del 
lobulo temporal. Esta corteza es importante para 
el analisis de sonidos complejos y estructuras 
rflmicas acusticas. Las regiones auditivas de 
asociacidn de los Idbulos temporales izquierdo 
y derccho se espccializan en diferentes funcio¬ 
nes que se analizardn posteriormente. En po- 
cas palabras, el lado izquierdo gobierna la 
comprensidn del lenguajc, mientras cl dcrecho 
los palroncs y ritmos auditivos no vcrbalcs. El 
dano a esta regidn cn cl Idbulo temporal izquier¬ 
do altera la comprensidn del lenguajc, mien¬ 
tras cl dano al lado derecho origina agnosia 
auditiva, dificultad para reconocer y discrimi¬ 
nar sonidos no verbales. Albert, Sparks, von 
Stockert y Sax (1972) informaron cl fascinante 
caso de un hombre dc 57 anos que sufrid una 
embolia aislada en la corteza dc asociacidn del 
Idbulo temporal derecho. £slc, quicn en olros 
sentidos tenfa excclentc funcionamiento, podia 
notar la existencia de un sonido, pero no po- 
dfa distinguir el timbre del leldfono, el ladrido dc 
un perro, el golpeteo de los cascos de un caba- 
I lo, un silbido, el pal moteo con las manos o el chas- 
quido de los dedos. No obstante, su perccpcidn 
dc los sonidos del lenguaje (una funcidn del 
Idbulo temporal izquierdo) estaba Intacta. 
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Junto con el hipocampo, las porcioncs mds 
centrales de la corteza temporal ayudan a man- 
tcner las funciones dc mcmoria a largo plazo. 
Como se estudia mds adelante, estas funciones 
son muy usimdtricas, con las funciones verba- 
les a la izquierda y las pictdricas a la dcrecha. 
Bn pocas palabras, las lesiones al Idbulo tem¬ 
poral izquierdo, a la cstructura subyacente del 
hipocampo o a ambas, deterioran el recuerdo 
demorado dc material verbal, como pdrrafos o 
listas dc palabras, ya sea que se prescnte de 
mancra visual u oral. Las lesiones al Idbulo tem¬ 
poral derccho, a la cstructura subyacente del 
hipocampo o a ambos causan dcfcctos cn cl 
recuerdo demorado dc material pictdrico, como 
dibujos geomdtricos y rosUos. Es tfpico que las le¬ 
siones al Idbulo temporal no altcren el recuerdo 
inmediato de material verbal o no verbal. 

Por ultimo, junto con las cstructuras sub- 
yaccntes dc la amfgdala, los ldbulos temporalcs 
tambidn participan en impulsos bioldgicos 
como agresidn, lemor y sexualidad. La eviden- 
cia para la pnrticipacidn de los ldbulos tempo¬ 
ralcs cn la motivacidn y emocidn provicne de 
das fuentes: estudios sobre cstimulacidn eldc- 
trica directa de esta regidn e investigacidn so- 
bre la alteracidn conductual cn personas con 
trastomosconvulsivosdel lobulo temporal. Por 
ejcmplo, Penficld y Jasper (1959) informaron 
que la cstimulacidn cldctrica leve de la corteza 
frontal y media del lobulo temporal producfan 
senlimicntos de temor, una respuesta que tam- 
bien sc obticnc dc la amfgdala. Bear (1986) ha 
catalogado los trastornos conductuales que pue- 
den ser rcsultado dc la disfuncidn cmocional 
secundaria al dafto al Idbulo temporal (cuadro 
9-3). Estos sfntomas describen la llamada per- 
sonalidad del Idbulo temporal, aunque pocas per¬ 
sonas combinan lodos estos rasgos. 

Se cierra este analisis con una nota pre- 
cautoria. Debido a que estos ldbulos son ricos 
cn concxioncs subcorticales hacia los ldbulos 
parietal, frontal, Ifmbico y occipital del cere- 
bro, las lesiones en esta region pueden causar 
sfntomas diversos que no sc cutalogan en lo 
dicho antes. Por ejcmplo, las lesiones al tem¬ 
poral pueden interferir con el reconocimiento 
visual. Esto lo demostrd inicialmente Milner 
(1958), quien cncontrd que sus pacientes tenfan 


Cuadro 9-3. Resumen de sfntomas 
que pueden ocurrir en la disfuncidn 
del lobulo temporal 

Compulsividad e hipersexualidad indiscriminada 
Hiperirritabilidad ante Insignificancias Irlviales 
Ansiedad y respuestas (dbicas 

Preocupaciones paranoides que se generalizan 
de manera amplia 

Periodos de depresidn, de euloria con agilacidn 
o ambos 

Preocupaddn por la religidn, cosmologfa o lilosolfa 

Escrltura, dlbujo o disertaciones extensas, pero 
improductivas 

Preocupaddn por los detalles 

Circunstancialidad, un estilo locuaz y tortuoso 

Viscosidad, una tendencia a prolongar los encuen- 
tros sociales 

Fuenlo: Basato en Sear, 0. M (1986) Behavioural changes In 
temporal lobe epilepsy En M R Trimble y T G Bolwig (Eds) 
Aspects of epilepsy and psychiatry Nueva York John Wiley 

un detcrioro cn el reconocimiento de anomalfas 
visuales (p, ej.. un mono dentro dc una jaula 
con una pintura al dleo sobre la pared). Kolb. 
Milner y Taylor (1983) encontraron que los 
pacientes con lesiones al temporal dcrecho no 
podfan pcrcibir la porcidn de un rostro del lado 
del campo visual izquierdo. Kolb y Whishaw 
(1985) describen este interesante sfntoma: 

... los pacientes con dado al Idbulo temporal 
derecho no parecen capaces de percibir las se¬ 
nates sociales sullies como esas mlradas dis¬ 
cretes, pero obvlas. al propio retoj, un ademdn 
que con Irecuencia tlene el propdsito de Indi- 
car que se debo suspender una oonversacidn. Se 
puede suponer que los pacientes no son capa¬ 
ces de percibir el signlficado de la serial visual. 

El lector interesado puede consultar a Kolb y 
Whishaw (1990) para un exaincn mds amplio 
de la disfuncidn del Idbulo temporal. 

LOBULOS FRONTALES 

Los ldbulos frontales se requieren para la pro- 
gramacidn, rcgulacidn y verificacidn de las fun- 
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clones ejecuti vas y cl desempefio motor (Luria, 
1973; Lezak, 1995). Las funciones ejecuti vas 
incluycn formulae irin y plunificacitin dc metas; 
ejecucidn de planes dirigidos al logro de objeti- 
vos y desempefio cficientc. Es con los lobulos 
frontalcs que los humanos intenlan, for man pla¬ 
nes y regulan su conducla al comparar los efcctos 
de sus actos con las intenciones originates. 

La puesta en marcha de un plan rcquicrc 
de un movimiento corporal de cierto tipo. Las 
personas buscan alcanzar sus metas a travds de 
ia mampulacidn Ij'sica del ambiente, ya sea con 
sus manos o a travds de la actividad motora del 
habla. Por tanto. no cs sorprendenle encontrar 
que la corteza motora principal sc localiza en 
los Idbulos frontalcs —dondc tambidn se for- 
man los planes c intenciones. 

La corteza motora primaria se encuentra 
en la circunvolucion precentral, en la parte Un- 
sera del Idbulo frontal, justo enfrente de la ci- 
sura central. La corteza motora tienc funciones 
contralaterales, donde la corteza motora iz- 
quierda controla los movimientos corporates a 
la derecha y vicevcrsa. Penfield (1958) fue el 
primero en cstablecer un mapa de la organiza¬ 
tion topica de la franja motora durante una se- 
ric de operaciones para retirar el tejido cortical 
dafiado en personas con epilepsia. Este investi- 
gador eslimuld diferentes Areas de la corteza 
motora con una corriente cldctrica inofensi- 
va para obtener un mapa de la correspondence 
entre aqudlla y diferentes partes del cuerpo. 
Penfield cncontrd que aquelias areas del cuerpo 
que requicrcn un control preciso, como dedos 
y boca, ocupan una cantidad desmesuradamentc 
grande dc cspacio cortical. 

Justo al frentc dc la corteza motora prima- 
rin se encuentra la corteza motora complcmcn- 
tnria. 6sta participaen cl ordenamientoen serie 
de cornplcjas cadenas motoras; es decir, en la 
programacidn del movimiento. Una porciOn de 
los Idbulos frontales justo por debajo de la cor¬ 
teza motora complementary participa en el con¬ 
trol de la mirada voluntary. El ldbulo frontal 
izquierdo tambidn media el lenguaje expresi- 
vo. que se examina en dctalle mAs adelante. 

El dafio a la corteza motora primaria causa 
problemas cn cl lado conlrario del cuerpo en 
cuanto a control motor fino y tambidn reduce 


la velocidad y fortaieza de los movimientos dc 
los miembros. Estos efcctos se dctectan con 
facilidad con pruebas motoras sencillas como 
velocidad de golpeteo con los dedos. El dafio 
grave a la corteza motora causa paralisis total 
dc las partes corporalcs afectadas. El dafio a la 
corteza motora complementary causa deficicn- 
cias en la cjecucidn de sccuencias motoras como 
la imitation de una serie dc movimientos facia- 
les y con cl brazo (Kolb y Milner. 1981). 

La causa mAs comun de dafio al lObulo fron¬ 
tal cs la IcsiOn cefAlica cerrada, que es un tipo 
dc IcsiOn traumatica de la cabeza (en el cuadro 
9-4 se describe este tipo dc lesidn y otras cau- 
sas dcstacadas de ncuropatologfa en el adulto, 
incluycndo sfndromcs relacionados con la 
edad). En una IcsiOn ccfalica cerrada, se aplican 
de mancra instantdnea fuerzas de accleracidn/ 
dcsaceleracion a todo el cerebro, como cuando 
la cabeza dc una persona choca contra cl yblcro 
de un automdvil en un accidente. Dcbido a las 
superficies irregulares del crAnco circundante, 
casi siempre resultan dafiadas las superficies in- 
feroanteriores de los lobulos frontalcs (Jennctt 
y Teasdalc, 1981). Los extremos frontales de 
los ldbulos temporales tambidn son sumamcn- 
te vulnerables en la lcsidn ccfalica cciTada. 

Nauta (1971) resume los efectos dc la dis- 
funcidn del lObulo frontal como un “trastomo 
dc la programaciOn conductual". Lezak (1983, 
1995) ha catalogado los trastomos conductualcs 
que pueden resultar del dafio generalizado, bi¬ 
lateral, al Idbulo frontal; 

1. Problemas de tipo mouvacionul que implican 
disminucidn de la espontancidad y produc- 
lividad, frecucncia rcducida de la conducta 
y falta de iniciativa. 

2. Dificuliadcs para hacer cambios mcntalcs y 
persevcrar en actividades y respucstas. 

3. Problemas para reprimirse, que con frecuen- 
cia se describe como impulsividad, reac- 
tividad exagerada y dificultad para contener 
una respucsta incorrecta o indeseablc. 

4. Dcficicncias cn la autoconciencia que resul¬ 
tan en incapacidad para pcrcibir los cnores 
cn el desempefio o estimar de mancra apro- 
piada las situacioncs sociales. 
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Lesion cerebral traumatica 
Bingler (1990), Oikmen y colaboradores 
(1995) 

Description: las consecuencias neurolbgicas 
dependen de la gravedad de la lesibn, pero to- 
das las siguienles son posibles: conlusiones o ma- 
gulladura del cerebro bajo el silio del impaclo (le¬ 
sion en golpe); conlusiones en el lado opuesto 
(lesibn on contragolpe); conlusiones frecuentes 
en las superficies inferiores de k>s Ibbulos fronta- 
les y en los extremos de los Ibbulos lemporales; 
lesibn axonal dilusa o dano inespecilico debido a 
efectos de fuerza de corte-dislensibn sobre las vlas 
neuronales; dark) al lejido cerebral debido a obs- 
truccibn del llujo sanguineo; hematoma o coagulo de 
sangre enlre el crbneo y la superficie del cerebro; 
edema o inllamacibn del mismo; las consecuen¬ 
cias a largo plazo incluyen la posible disminuclbn 
en el tamaho del cerebro y el agrandamlenlo 
correspondienle del sistema ventricular. 

Eleclos neuroconducluales potentiates: las 
dolertcias mbs comunes, y confiables, se refieren 
a problemas de concentracibn y memoria; olras 
generalizaciones son dificiles debido a que" la 
naturaleza y gravedad del dano cerebral no serb 
el mismo en cualesquiera de dos pacientes; el 
dano focal puede conducir a sintomas especifi- 
cos; por ejemplo, el dano en las breas de len- 
guaje del hemisferio izquierdo puede causar 
alasia expresiva; muchos esludios sugieren que 
los pacientes con lesibn cerebral traumbtica tie- 
nen una afectacibn mbs grave a causa de los 
trastornos de personalidad y emocionales que de 
las discapacidades cognilivas y fisicas (Lezak y 
O’Brien. 1990). 

Enfermedad neoplasica (Tumor) 

Reitan y Wolfson (1993) 

Descripddrr. la enfermedad neoplbsica engloba 
muchas formas diferenles de crecimienlos 
tumorales; por ejemplo. los gliomas son tumores 
en forma de zarcillo de cblulas gliales que inliltran 
al cerebro a lo largo de un periodo de semanas o 
meses; los mengiomas son tumores de crecimien- 
to mbs lento, con forma globular, de las meninges 
(las membranas que encierran al cerebro), las 
cuales presionan el cerebro. 

Efectos neuroconducluales potentiates: los 
tumores cerebrates producen una variedad de 


efectos, dependiendo de la localizacibn y lamafio; 
los tumores de infiltracibn rbpida pueden com- 
prometer muchas habilidades; por ejemplo, 
habilidades de lenguaje y para solucibn de 
problemas. funciones motoras y sensoriales 
del lado derecho, si estb afectado el hemisferio 
izquierdo; los mengiomas de crecimienlo mbs 
lento pueden conducir a sinlomas locales que se 
relacionan con el silio de invasibn on el cerebro; 
por ejemplo, dbficit en la capacidad espacial y 
delerloro en las funciones motoras y sensoriales 
en el lado izquierdo si se afecta al brea parieto¬ 
frontal derecha. 

Abuso crbnico del alcohol 
Dbvila y colaboradores (1994) 

Descripcidn: la ingeslibn crbnica de alcohol 
conduce a cambios en las neuronas que inclu¬ 
yen perdida de ramas y espinas dendrfticas, en 
especial, en el hipocampo y en la circunvolu- 
cibn dentada; lambibn se observa agrandamlenlo 
de los ventriculos y aumenlo en la amplitud de 
las cisuras; en casos graves se encuentra atrofia 
del tblamo medial y de los cuerpos mamilares 
(sindrome de Wernicke-Korsakoff); la neuro- 
patologfa del alcoholismo puede exacerbarse por 
deflciencias vitaminicas y nutricionales. 

Efectos neuroconductuales potentiates: en casos 
de abuso grave del alcohol en el que se encuen- 
tran comprometidos el tblamo medial y los cuerpos 
mamilares, se observa la profunda amnesia an- 
terbgrada del sindrome de Wernicke-Korsakoff; 
los pacientes muestran una incapacidad para 
conservar el recuerdo de acontecimientos por mbs 
de un corto tiempo, aunque la memoria inmediala 
estb intacta y la memoria remota sblo mueslra un 
dano leve; se presents confabulacibn o falsifi- 
cacibn de recuerdos con conciencia dara; otros 
sintomas de abuso grave incluyen alleraciones 
do la marcha y dificultades con la mirada; en 
alcohblicos neurolbgicamente intactos, los efec¬ 
tos neuroconductuales son mbs esquivos, pero 
pueden incluir deficiencies sutiles en memoria y 
dificultades para la solucibn de problemas 
novedosos. 

Enfermedad de Alzheimer 
Knight (1992), Koss (1994) 

Descripcidn: la enfermedad neurolbglca 
degeneraliva mbs comiin es la Enfermedad de 
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Alzheimer (EA). que presenla una degeneracidn 
insldiosa del cerebro; la fisiopatologfa incluyo 
depdsitos con forma de masas en el cerebro 
que constan de placas neurfticas y maranas neu- 
rofibrilares; cambios cerebrates adicionales 
Incluyen perdida neuronal, encogimiento o atrofia 
del cerebro, reduccidn de los neurotrasmiso- 
res acelilcollna que participan en la memoria y 
acumulacidn de depbsitos extrahos en la vas- 
culatura cerebral; el curso Invariable de la en- 
fermedad es en declive. Oescrito Inicialmente 
en 1907, Alois Alzheimer describid su primer caso 
como sigue: 

El primer sintoma notable de la enlermedad que 
moslrb esta mujer de 51 afios de edad luo suspl- 
cacia acerca de su esposo. Pronto se hizo evi- 
denle un aumento rapido de su deterioro de 
memoria; ya no podia orientarse en su propia vi- 
vrienda, llevaba los objelos de un lado a otro y los 
ocullaba y en ocasiones, al creer que olras per¬ 
sonas pretendian asesinarla, comonzaba a gri- 
lar a voz en cuollo. Al observarla on la Inslltucibn, 
lodo su procedor tiene el aspecto de oomptota 
perplejidad. EstA absolulamente desorientada en 
tlempo y lugar (La Rue, 1992). 

Aunque la enfermedad de Alzheimer no es parte 
del enveiecimienlo normal, la edad avanzada es 
un factor importante de riesgo; rara antes de 
los 65 afios de edad, la enfermedad aflige a 3% 
de las personas entre 65 y 74 afios, a 18% de 
aquAllas entre 75 y 84 afios y a casi la mitad 
de aquellos de 85 afios en adelante (Evans. 
Funkenstein, Albert y otros, 1989). 

Efectos neuropsicoldgicos potentiates: como 
delallaron Slorandt y Hill (1989), la dificultad para 
la adquisicidn de informacidn nueva (disfuncidn 
de la memoria a corto plazo) es, en trminos 
generales, el sintoma mAs notable en las primeras 
elapas; los pacientes tambien pueden moslrar una 
notablo disfuncidn del lenguaje (p. ej., dilicultad 
pronunciada para encontrar las palabras) o un 
trastorno visoespacial sobresallente; lambidn son 
comunes los informes de cambios de persona- 
lldad. incluyendo delirios y agitacidn; las ultimas 
elapas se caracterizan por una dlscapacidad 
grave y generallzada. 


Demoncia vascular 
Mirsen y Hachinski (1988) 

Description-, segunda causa mAs comun de 
demencia en los ancianos, la demencia vascular 
es produdo del bloqueo de una arteria y de la 
consiguiente necrosis del tejido cerebral debido 
a Insuficiencia en la irrigacidn sanguinea (infarto) 
o al sangrado dentro o alrededor del cerebro 
(hemorragia); el inido repentino es la regia, pe- 
ro la acumulacidn de pequenas embolias a lo largo 
del liempo, lo cual se conoce como demenda por 
infartos multiples (DIM), puede producir un 
Irastomo aparontemente progresivo. La Hachinski 
Ischemic Score (Puntuacidn isquemica de 
Hachinski) se desarrolld para discriminar entre 
la demencia por Infartos multiples y la enferme¬ 
dad de Alzheimer (Hachinski, lliff, Zilha y otros, 

1975). La DIM se indica por la presenda de varios 
de los siguientes faclores: Inido abruplo, males- 
tares somalicos, deterioro por pasos, incontinen- 
da emocional, fluctuacidn en el curso de la enfer¬ 
medad, antecedents de hipertensidn, confusidn 
noclurna, antecedentes de embolia, preserva- 
cidn de la personalidad, presenda de ateroesclero¬ 
sis, depresidn y signos neuroldgicos locales. 

Debido a que la DIM puede tralarse de manera 
parcial, el diagndstico diferencial de Asia contra la 
EA es mAs que una cuestion acaddmica; el curso 
de la enfermedad en la DIM es mAs corto que en 
la EA, pero mAs variable de una persona a otra. 

Eletios neuroidgicos potentiates: el sindrome por 
accidentes cerebrovasculares se define por el 
Inicio agudo de un ddficit focal que implica al 
Sislema Nervioso Central; los sfnlomas dependen 
del sitio del Infarto, pero pueden incluir debili- 
dad motora y deterioro en la sensibilidad en los 
miembros opuestos; si el hemisferio dominant 
esta afectado puede haber presenda de afasia 
de falta de lluidez; la embolia en la parte trasera del 
cerebro puede producir perdida parcial del campo 
visual; los slntomas agudos pueden disminuir 
parcialmente y conducir a una meseia de fun- 
donamiento estable. 

Mai de Parkinson 
La Rue (1992) 

Description: el mal de Parkinson es casi 
inexistente antes de los 40 afios de edad y afecta 
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solo a 1 o 2 personas de cada 1 000 con edades 
de 70 anos en adelante; es principalmenle un 
trastorno del movimlenlo, pero tambien son 
comunes los problemas cognitivos y emocionales. 
Las elapas linales de esle mal pueden implicar 
una demencia evidenle; los sinlomas incluyen 
lentitud de movimienlos (bradicinesia) temblor 
en reposo, andar pesado y rigidez postural; la 
neuropatologia implica disminuddn de dopamlna 
y perdida neuronal en los ganglios basales. 

Efectos neurocortdutiuales potentiates, el temblor 
es el sintoma inlcial mds comun y menos de- 
bilitante; la tasa de progreso es bastante variable, 
pero la discapacidad de movimienlo en el mal de 
Parkinson puede volverse pronunciada y conducir 
al inlernamiento; de 10 a 20% de los pacientes 
con este mal desarrollan una demencia evidente; 
ademas revelan un deficit en pruebas neuro- 
psicoldgicas que requieren velocidad (p. ej., 
Dfgltos y simbolos, (areas de Irazado de un camino 
y medidas de tiempo de reaccidn); de manera 
sorprendente, las pruebas de discriminacidn 
visual y de aprendizaje de pares asociados que 
no requieren velocidad tambidn dlferencian a los 
pacientes con mal de Parkinson moderado a grave 


de los controles equiparados (Pirozzolo, Hansch. 
Mortimer, Webster y Kuskowski, 1982); cerca de 
40 a 60% de los pacientes con mal de Parkinson 
lambidn experlmentan depresidn. 

Sindrome demencial de la depresidn 
Blazer (1993) 

Descripddrr. cerca de 10 a 20% de los ancianos 
con depresidn muestran deficiencies cognitivas 
que se asemejan a la demencia orgdnica; la 
perdida de memoria en combinacidn con quejas 
graves de discapacidad son aspectos comunes. 
El sindrome demencial de la depresidn (conocido 
tambidn como seudodemencia) es principalmenle 
un diagndstico posterior que se define por un 
regreso al desompeno cognitivo normal despuds 
de que se trata la depresidn grave. 

Electos neuroconduduales potentiates, es comun 
la pdrdida de memoria tanto de acontecimientos 
recientes como remotos; se conservan la alencidn y 
concentracidn; las habilidades sociales pueden 
moslrar perdidas notables en etapas iniciales; 
se observa una notable variatxlidad en el desompeno 
en pruebas cognitivas, incluso entre tareas 
similares. 


5. Una actitud concrcla (Goldstein, 1944) cn la 
que los objetos, cxpcricneias y conducta se 
toman por su valor superficial mds obvio. 

Es curioso que las lesioncs al Idbulo frontal 
pueden tener poco efccto sobre cl aprendizaje 
anterior o las habilidades bien establecidas. 
Tanto Hebb como Penfield informaron que la 
cxlirpacidn quirurgica del tejidodel Idbulo fron¬ 
tal causaba poco cambio en las puntuaciones 
del Cl (Hebb, 1939; Penfield y Evans, 1935). 
Los primeros cstudios sobre la lobotomfa pre¬ 
frontal demostraron, en gran medida, las mis- 
mas conclusiones: no existe cambio cn el Cl o 
incluso una pequena mejorfa despuds de la des- 
conexidn de los Idbulos frontales. 

Ha resultado diffcil el diseno de medidas 
adecuadas de la funcidn del Idbulo frontal. 
Lczak (1995) scfiala que los trastornos de dstc 


cambian la manera en que una persona respon- 
de, mientras la mayor parte de las pruebas irude 
lo que una persona sabe. Esla autora ha diseno- 
do un ingenioso mdtodo llamado Prucba 
Tmkertoy*, el cual se analizard cn cl siguiente 
tema, para evaluar las dificultadcs de progra- 
macidn que experimental! las personas con Ic- 
siones en el Idbulo frontal. Es mds comun que 
los clfnicos dependan de la observacidn y de 
listas de verificacidn para diagnosticar la 
disfuncidn del Idbulo frontal. Un instrumento 
util para este propdsito cs la Checklist of 
Executive Functions (Lista dc Verificacidn dc 
Funciones Ejccutivas; Pollens, McBratnic y 
Burton, 1988). Los reactivos en esta lista defi- 
nen importantes aspectos dc las funciones de! 
Idbulo frontal: concicncia. establecimicnto de 
melas, planificacidn, autoiniciacidn, autoinhibi- 
cidn, automonitorco, capacidad para cambiar 
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de propensidn y conducts estratdgica. Cada rcac- 
tivo sc califica en una escala de 1 a 5. dc modo 
quc la puntuacidn total proporciona un indice 
de la intcgridad dc las funcioncs ejccutivas. 


^LATERALIZACION CEREBRAL 
‘, DE LA FUNCION 

Hasta estc momcnto sc han destacado las se- 
mejanzas cntre ambas mitadc.s del ccrebro, cn 
particular con respecto al procesamicnto con¬ 
tralateral dc las funciones sensoriales y motoras. 
No obstante, en muchos aspectos importantes, 
los dos hemisferios del ccrebro humano son 
asim&ncos anatomica y funcionalmcntc (Cytowic, 
1996; Gcschwind y Galaburda, 1987). Las asi- 
metrias cstructuralcs importantes incluycn las 
siguientes: 

1. La parte superior del Idbulo temporal, el pia¬ 
no temporal, es mils grande en el hemisferio 
izquierdo. 

2. El hemisferio izquierdo contiene mis mate¬ 
ria gris, aunque es un poco mis pequeha y 
ligera que en el hemisferio dcrccho, 

3. La cisura lateral es mucho mis larga cn el 
hemisferio derecho, por lo que la corteza 
parietotemporal es ligeramente mis grande 
en estc I ado. 

Por supucsto, ocurririn excepciones en casos 
individuates. Las diferencias antes listadas son 
las mis consistentcs y pronunciadas en perso¬ 
nas diestras y cn varones. Los zurdos y las mu- 
jcrcs mucstran menores asimetrfasestructuralcs 
y funcionalcs del ccrebro (Weckes, 1994). 

Las asimetrfas cstructuralcs entre los hc- 
mtsferios se correlacionan con diferencias fun- 
cionales bicn conocidas entre ambos lados del 
ccrebro. El mayor tnmaiio de ciertas secciones 
del irea temporal cn cl lado izquierdo esti, en 
parte, al servicio del lenguaje. mientras quc el 
de algunas secciones del irea parietotemporal 
cn el lado derecho esti parcialmente al servicio 
del pensamiento espacial. En lo que resta dc 
esta seccidn se catalogarin aiin mis las espe- 


cialidadcs dc los hemisferios izquierdo y dere¬ 
cho. pero se adviertc de antemano al lector que 
la lateralizacidn dc la funcidn es una cucstidn 
rclativa y no absoluta. Porejemplo, ambos he¬ 
misferios tienen cierto grado de capacidad ver¬ 
bal y espacial. Lo que es mis. casi cualquier 
actividad tntclcctual dc alto nivel rcquicre de 
la interaccidn sintdlica de todo el cercbro 
(Efron. 1990). El habla es un ejemplo a prop6- 
sito; aunque es principalmentc una funci6n del 
hemisferio izquierdo, el hemisferio cerebral 
derecho proporciona los patrones de cntonacidn. 
Como rcsultndo. los pacientes con lesiones en 
el lado derecho (cn particular cn el irea fron¬ 
tal) pueden hablardc mancra inquielantemcnte 
monotona (Gardner. 1975). 

EL LENGUAJE COMO FUNCION 
DEL HEMISFERIO IZQUIERDO 

El lenguaje es principalmentc (pero no cxclu- 
siva) una funcidn del hemisferio izquierdo en 
la que parlicipan estructuras corticales y sub- 
corticales ampliamente separadas. Debido a que 
tantas regiones de este hemisferio contribuycn 
al lenguaje, casi cualquier lesidn importante en 
esta irea produciri algun tipo de alteraci6n cn su 
produccidn o comprensidn. Por esta razdn, 
un perfil dctallado del lenguaje ofrecc una ven- 
tana hacia la intcgridad y funcionamiento del 
hemisferio izquierdo. 

Los conceptos modemos acerca de las co- 
rrelaciones cercbro-lenguaje provienen. de he- 
cho.dcl sigloXIX. En 1861, Paul Broca observd 
que el dano cn una pequefia regidn justo cn- 
frenle de la corteza motora del hemisferio iz¬ 
quierdo causaba un trastomo del lenguaje, al 
que originalmcntc sc llamd afasia expresiva, 
ahora conocido cornu afasia de falta dc fluidcz. 
Las personas con dano en esta area premotora 
cn el hemisferio izquierdo —llamada como de- 
berfa ser irea de Broca— hablan de manera 
lenta y trabajosa. Tienen dificultad para enun- 
ciar correciamcnie las palabras; el acto de ha- 
blar les parece tortuoso. El habla asume una 
naturaleza francamente telegrafica; con fre- 
cucncia sc omiten los adjetivos, adverbios, ar- 
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tfculos y conjunciones —las palabras quc Ic 
dan color al habla. l-a redaccidn lambidn cs di- 
ffcil para eslos individuos. Por fortuna, las per¬ 
sonas que experimental! afasia de Broca tiencn 
poca dificullad para comprendcr ya sea cl len- 
guaje hablado o escrito. En su forma pura, estc 
irasiorno implica sdlo al Icnguaje exprcsivo. 

En 1874. Wernicke anuncid quc cl dafio a 
la porcidn superior y poslerior del Idbulo tempo¬ 
ral izquicrdo —una regidn que ahora sc conoce 
como drca de Wernicke— se vinculaba con un 
irastomo del lenguajc quc cn principio se deno¬ 
mind afasia receptiva y ahora sc conoce mds 
como afasia fluida. Los individuos afcctados 
parecen incapaces de comprender el lenguajc 
hablado o escrito. En apariencia, las personas 
con afasia de Wernicke no tiencn dificultad para 
percibir las palabras, pero no pueden asociarlas 
con su signiftcado subyaccnte. En consecuen- 
cia, las cxpresioncs escritas y vcrbalcs de las 
personas con esta afasia son fluidas, pero carecen 
de significado. Por ejemplo, cuando se lc pidc 
quc defina la palabra Hbro, un pacientc podn'a 
responder: "libro, un macinto. un rey de prepa- 
rador. lo cncuentras al frente de un auto listo 
para dirigirlo". La misma persona podrfa defi- 
nir espantapdjaros como: “diremos que es una 
bmja dc riesco de tres minutos, cncontrards 
una cn el campo en Ires brujas" (Williams, 1979). 


Con base cn las observaciones dc Broca y 
Wernicke, Geschwind (1972) propuso un mo- 
delo estructural, ncuroldgico dc las funciones 
dc Icnguaje del hemisferio izquicrdo. que ha 
tenido gran influcncia cn la evaluacidn neuro- 
psicoldgica. Este modclo ticne que ver de ma- 
ncra dirccta con la evaluacidn de las habiiidadcs 
dc Icnguaje; a conlinuacidn sc dcscibren los 
principalcs elementos y se presentan en la figu- 
ra 9-5. Geshwind propuso lo siguiente: 

1. El lenguaje hablado se percibc cn la corteza 
auditiva izquierda, en la parte superior del 
Idbulo temporal, y despuds se transfiere al 
ilrca dc Wernicke. 

2. En el drea de Wernicke se acti van los sigmfica- 
dos de las palabras y se iransportan los eddi- 
gos auditivos a un haz subcortical dc ftbras 
(ransmisoras llamadas fascfculo arqueado. 

3. El fascfculo arqueado cnvfa los eddigos 
auditivos directamcntc al drca dc Broca. 

4. Al llegar al drea dc Broca, el eddigo auditivo 
activa al eddigo de articulacidn conespon- 
diente, el cual especifica la secuencia de 
accioncs musculares requeridas para pronun- 
ciar una palabra. 

5. A su vez, el eddigo dc articulacidn se trans¬ 
mite a las porcioncs de la cortcza motora quc 
gobieman a la lengua, labios, laringe y asf 



Figure 9-5. Modelo estructural de las lunclooes de lenguaje del hemisferio Izqulerdo. 
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sucesivamente. a fin dc producir la palabra 
huhlada quc se desea. 

Comprcnder o leer una palabra cscrila implica 
la mayor parte de las vfas descritas. pero con 
un punto de inicio diferentc: 

6. Las palabras cscritas se registran primero en 
la corteza visual y despuds se envfan a tra- 
vds dc la corteza visual de asociacidn a la 
circunvolucidn angular. 

7. En la circunvolucidn angular, la forma vi¬ 
sual de la palabra se conviertc en un eddigo 
auditive quc se almaccna en cl irea de 
Wernicke, con lo cual se tienc acceso al sig- 
nificado de la palabra cscrita, quc (ambiin 
puede scr hablada (pasos 2 a 5 anteriorcs). 

El modclo dc Geshwind es util para explicar 
varios sfndromes clfnicos producidos por cl 
dano cerebral aislado en el hemisferio izquier- 
do (Gregory, 1999): 

• Las lesiones en cl irca dc Broca enusarin un 
habla lenta, trabajosa, tclcgrifica, pero no sc 
vera afcctada la comprensidn del lenguaje ha- 
blado o escrito. 

• El dano al irea de Wernicke tendri impli- 
cacioncs mis graves y gcncralizadas para la 
comprenstcSn del lenguaje; es deeir, el paciente 
no podri comprcnder las comunicaciones 
habladas o escritas. 

• El dano a la circunvolucidn angular produci¬ 
ng grave discapacidad para la lectura, pero 
habra pocos problcmas para comprcnder 
cl habla o para hablar. 

• El deterioro limitado a la corteza auditiva iz- 
quierda resultari en grave trastomo de la com- 
prension verbal. Sin embargo, las personas 
que lo padezean podrin hablar y leer con nor- 
malidad. 


En la prictica, pocos pacicntes revelan sfnto- 
nws de afasia quc sc encuentren dc manera clara 
dentro dc una u otra dc las catcgorfas antcrio- 
***• Lo quc es mds, los conceptos modernos 
*obrc la afasia scnalan debilidadcs en cl modc¬ 
lo Upico (p. ej., su punto de vista demasiado 


simplista accrca de la estructura del lenguaje) y 
proponen un modelo complejo, no lineal, de la 
afasia que se encucnlra mds alld de la cobcrtu- 
ra de este libro (Cytowic, 1996; Whitaker y 
Kahn, 1994). No obstante, una evaluacidn mi- 
nuciosa de las funciones del lenguaje es parte 
esencial dc loda valoracidn neuropsicologica y 
cl modelo caracterfstico dc Broca, Wernicke 
y Geshwind proporciona un punto dc inicio pro- 
vechoso. Pucdcn cncontrarsc perspcctivas adi- 
cionales sobrc la afasia y cl modelo cstructural 
del lenguaje en Benson (1994) y Mayeux y 
Kandcl (1991). 


S FUNCIONES ESPECIALIZADAS 
Da HEMISFERIO DERECHO 


Con base en estudios sobrc personas sanas y con 
dano cerebral, ahora se encuentra ampliamente 
cstablecido que el hemisferio dcrecho es domi- 
nantc para una variedad de habilidadcs cogni- 
tivas y pcrceptuales. Sin embargo, un anilisis 
detallado de las funciones cspecializadas del he¬ 
misferio derecho csti mis alii del espectro dc 
csta seccidn. Pueden enconlrarse resenas com- 
petentes dc la extensa literatura sobrc este tema 
en Bradshaw y Mattingley (1995), Joseph 
(1988), Kupfertnann (1991b), Dean (1986) y 
Springer y Dcutsch (1985). En general, el he¬ 
misferio derecho parece ser dominantc en el 
anilisis del espacio geomdtrico y visual, com- 
prensidn y expresidn de emociones, procesa- 
miento dc la musica y sonidos ambientales no 
verbales, produccion de recuerdos no verbales 
y espaciales y rcconocimiento tic til de formas 
complejas. 

Un sfntoma frecucnlc dc dado en cl hemis¬ 
ferio dcrecho es la dispraxia de construccidn, 
que es cl deterioro en la capacidad para manejar 
relacioncs espaciales en un esquema bidimen- 
sional o tridimensional (Rcitan y Wolfson, 1993). 
Este sfntoma suele exhibirse a travis del detc- 
rioro en la capacidad para copiar formas senci- 
llas como una cruz. Las lesiones al hemisferio 
izquierdo tambiin pueden causar dispraxia de 
construccidn, pero la corrclacidn es mcnos 
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consistente. La mayor parte de las baterfas de 
pruebas neuropsicolbgicas incluyen una o mbs 
tareas de copiado para dctcctar este trastomo. 
En el cuadro 9-5 sc resumen las conclusiones 
sobre lateralizacibn cerebral. 


"PRUEBAS CLINICAS Y TUNICAS 
;VV> DE IMAGENOLOGIA CEREBRAL 


Se han inventado diversas pruebas clinicas y 
tdcnicas de imagenologfa del cerebro para asistir 
en el diagnbstico (Cohen y Bookhcimer, 1994: 
Kandel, Schwartz yJessell, 1995;Raichle. 1994). 
Debido a que la evaluacibn neuropsicologica 
con frecuencia va de la mano con estos proce- 
dimientos mbdicos, se proporciona una breve 
introduccibn acerca de las pruebas clinicas y 
tdcnicas de imagenologfa cerebral de mbs utili- 
zacibn (cuadro 9-6). Son los neurblogos y otros 
medicos especializados en enfermedades del 
sistema nervioso quiencs autorizan y utilizan 


exclusivamcntc estos procedimientos. Adem5 s 
de un examen de consulta que se enfoque c n 
los antecedentes del pacientc, su cstado men¬ 
tal, reflejos motores, funcionamiento sensorial 
y habilidad motora, por lo comun el neurblogo 
utiliza una o mbs pruebas clinicas para ayudar- 
se a diagnosticar o descartar una enfermedad 
neurolbgica. Dichas pruebas son esenciales para 
llegar al diagnbstico correcto del padecimiento 
mddico del pacientc. No obstante, no recmpla- 
zan a las pruebas neuropsicolbgicas ncccsarias 
para sehalar las consecucncias funcionales de 
los padecimientos neurolbgicos. 


f APLICACIONES DE LOS 
HALLAZGOS DE PRUEBAS 

neuropsicol6gicas 


Ahora que sc han revisado los aspectos csen- 
ciales de la estructura y funcibn del cerebro 
humano, el lector deberfa comprendcr mejorel 


Cuadro 9-5. Resumen de los hallazgos sobre lateralizacibn cerebral 


Sistema funcional 

Predominio del hemisferio 
izquierdo 

Predominio del hemisferio 
derecho 

Visibn 

Procesamiento del campo visual 
derecho 

Reconocimiento de letras, palabras 

Procesamiento del campo visual izquierdo 

Reconocimiento de rostros 

Audicibn 

Procesamiento del oldo derecho 
Procesamiento de sonidos relacio- 
nados con el lenguaje 

Procesamiento del oido izquierdo 
Procesamiento de musica y sonidos 
ambientales 

Somatosensorial 

Entrada sensorial del lado derecho 

Entrada sensorial del lado izquierdo 

Movimiento 

Salida motora hacia el lado derecho 
Movimiento volunlario complejo, in- 
cluyendo habla 

Salida motora hacia el lado izquierdo 

Lenguaje 

Habla. lectura, escritura y aritmetica 

Entonacibn y patrbn emocional del habla 

Memoria 

Memoria verbal 

Memoria pictbrica 

Procesos 

espaciales 


Analisis de espacio geomblrico y visual 

Emocibn 


Comprensibn y expresibn de emocibn 

Olfato 

Olfato en la fosa nasal izquierda 

Olfato en la fosa nasal izquierda 
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Cuadro 9-6. Pruebas clmicas y tecnicas de imagenologia del cerebro utiles 
en el diagnostico neurologico 


Electroencefalografia (EEG) 
g EEG produce un registro de la actividad elec- 
lr»ca de la corteza a partir do eloctrodos colocados 
0 n areas espedficas del crbneo. Las flucluaciones 
en actividad se representan como llneas de tinta 
separactas que se dlbujan en un rollo de papel 
conllnuo. El EEG es un (ndice rudimentarlo, dado 
que las flucluaciones de un momenlo a otro de 
cada Ifnea de tinta reflejan la actividad sincro- 
nlzada de millones de neuronas. La prueba es util 
para el diagnbstico de trastornos convulsivos y 
en la localizacibn de actividad cerebral anormal, 
como la provocada por un tumor. 

Angiografia cerebral 

En esla tecnica se inyecta un tinte especial opaco 
a las ondas de radio en una de las principals 
atlerias que irrigan al cerebro (arteria vertebral o 
carbtida) y despubs se loma una radiograffa del 
cerebro Debido a que el linte bloquea los rayos X, 
el slstema arterial del cerebro resalta en evidente 
relieve en negativo. Asf, el medico puede localizar 
lasanormalidades vasculares como un aneurisma 
(un abultamiento peligroso de una arteria). Tam- 
blen, si una arteria se encuentra desplazada de 
su localizacibn normal, el especialista puede inte¬ 
rn una patologia subyacente como la existencia de 
un tumor. La angiografia traditional representa un li- 
gero riesgo para el paciente, porque la inyeccibn 
de tinte puede causar complicaciones neurolo- 
gicas. Con los avances conllnuos en la tbcnica, 
es probable que la angiografia con resonancia 
magnbtica reemplace a los enfoques tradicionales. 

Tomograffa computarlzada (TC) 

En un raslreo de TC, un estrecho haz de rayos X 
atraviesa el cerebro desde docenas de bngulos 
diferontes; la mbquina detecta la cantidad de ra¬ 
yos X que surgen del otro lado. La densidad de 
las diferentes estrucluras internas aparece en 
pellculas de radiografla en proportion inversa a 
auabsorcion de rayos X. Una computadora resuel- 
ve los aspectos matemblicos para reconstruir una 
representation tridimensional de las densidades 
internas del cerebro, con lo cual se revelan eslruc- 
luras Importantes. La computadora imprime 
aproximadamente ocho radiograffas transversales 
bktimensionales del cerebro, cada una desde un 
piano diferente. La TC produce una resolution de 
menos de 1 mm; se pueden observar con fatilidad 
its tumores, cobgulos de sangre y desplaza- 
mientos ventriculares. La TC es menos danina 
Sue una radiografla tradicional de tOrax. 


Tomograffa por emisiOn de positrones (TEP) 
En un rastreo TEP, al paciente se le inyecta una 
forma radioaclivamente marcada de glucosa, el 
combustible metabOlico esencial del cerebro. El 
nivel de radioactividad es extremadamente 
limitado y no se considers danino. DespuOs se 
registra la radioactividad a travos de un detector 
especial que rodea al crbneo del paciente. Debido 
a que la glucosa va hacia las partes mbs activas 
del cerebro, el rastreo TEP mide el nivel de acti¬ 
vidad y no la estructura en si. Por tanto, se puede 
utilizar un rastreo TEP para eslimar la actividad 
cerebral regional, lo cual puede ser util en el diag- 
nOstico de la enfermedad de Alzheimer, esquizo- 
Irenia y otros padecimientos en los que exisle 
deterioro cerebral. Los rastreos TEP tambiOn 
pueden ulilizarse para localizar los silios recepto- 
res al hacer que el paciente inhale un gas radioac- 
tivo que se fija a sitios receptores especificos, 
como los de dopamina en los ganglios basales. 
El principal inconveniente del TEP es el nivel de 
tecnologia requerido. Algunas aplicaciones 
requieren un ciclotrbn cercano para la creatibn 
de Isbtopos de vida corta. 

Imageries por Resonancia Magnbtica (IRM) 

El principio funcional de las IRM es que ciertos 
btomos como el hidrogeno se comportan como 
pequenos imanes giratorios. Cuando se les coloca 
en un fuerte campo magnbtico, estos atomos se 
alinearbn entre si. Cuando despubs se lancen 
ondas de radio a los btomos en bngulos rectos 
con respecto al campo magnbtico, los btomos 
oscilarbn de manera sincronica entre si. En el 
momento en que se apagan las ondas de radio, 
un serpentfn de alambre que rodea al crbneo 
detectarb el voltaje o resonancia magnbtica en el 
campo magnbtico, dortde el voltaje serb mbs fuerte 
en las breas que contienen mayores concenlra- 
ciones de hidrbgeno. Debido a que muchas partes 
del cerebro son ricas en hidrbgeno (en especial 
aquellas que contienen agua o H 2 0), el patrbn 
diferencial de resonancia magnbtica ayuda a 
revelar las estrucluras cerebrales subyacentes. 
La resolutibn espacial de las IRM es tan nftida 
que las imbgenes se asemejan a material 
anatbmico seccionado y fijo. Un nuevo procedi- 
miento que se conoce como angiografia por 
resonancia magnbtica, promote reemplazar a 
procedimientos mbs peligrosos e invasores 
como la angiografia cerebral traditional. 
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significado ncuroldgicode los resultados cn una 
prueba psicologica; pero en la evaluaciAn neu- 
ropsicolAgica participa mas que la mcra com- 
prcnsiAn de la funciAn cerebral. Sc concuerda 
con Kolb y Whishaw (1990) en que el valor de 
la neuropsicologfa no reside sdlo en su contri- 
bucion a una comprensiAn de la funciAn del 
cerebro, sino tambidn cn la posibilidad de apli- 
caciAn de sus conocimientos basicos a los pro- 
blcmas humanos. Para ilustrar estas cucstioncs 
cntrelazadas —las pruebns con base ncuropsi- 
colAgica conduccn a una comprensiAn y Asta a 
la aplicaciAn— se regresa al caso del cstudian- 
te reprobado cn la escuela de preparaciAn para 
estudios de medicina. 

El lector podrfa dcscar examinar los rcsul- 
tados de prueba de este esludiante reprobado 
que se presentan al principio del capftulo 
(ejcmplo de caso 9-1) bajo la perspcctiva del 
conocimiento obtenido de las pdginas anterio- 
res. Con propAsilos de una revisiAn rdpida, cl 
estudiante habfa reprobado cursos como quf- 
mica organica y cmbriologfa a pesar su Cl 
Total superior de 122. Ademds de su puntua- 
ci6n sospechosamcntc baja en una prueba de 
pensamiento abstracto (Prueba de categortas), 
el estudiante no podfa copiardc manera precisa 
una cruz griega y su velocidad de golpeteo con 
los dedos para la mano izquierda era bastante 
lenta en tArminos comparativos. El lector puc- 


de reconoccr el primer sfntoma —la dificuhad 
para copiar una forma— como dispraxia de 
construcciAn, lo cual indica con frecucncia un 
daiio en el hemisferio derecho. Debido a que |g 
dispraxia senala una grave debilidad para ma- 
nejarrelacionesespacialcs, ladificultad deeste 
estudiante con la qufmica organica y la cm¬ 
briologfa no sorprende. Ademds, el segundo 
sfntoma —Icntificacion motora en la mano 
izquierda— tambicn sugiere alteraci6n en cl 
hemisferio derecho. La mano no dominanic 
deberfa ser aproximadamente 10% mds lent# 
que la mano dominante (Rcitan y Wolfson. 
1993). En este caso, la mano no dominante es 
25% mds lenta que la dominante (56 comra 42). 
Aunque la causa continua siendo un misterio, 
una tomograffa computarizada (TC) con fimM 
que el estudiante de prcmedicina habfa sufn- 
do una lesiAn estdtica en la regidn frontoparietal 
del hemisferio derecho. Por supuesto, este he- 
cho podrfa habersc revelado solo con cl uso de 
la TC, sin referenda a los resultados de una 
prueba ncuropsicolAgica; sin embargo, la bate- 
rfa de pruebas satisfizo un propAsito util al do- 
cumentar las consecuencias funcionales del 
daho cerebral. De manera incidental, el cstu- 
diante cambiA a una carrera cn historia —una 
busqueda academics mds compatible con sus 
fortalezas en el hemisferio izquierdo— y se 
graduA con un titulo cn educaciAn. 


BUresumen 


1. La neuropsicologfa es el estudio de la rela- 
ciAn entre funciAn cerebral y conducta. En 
la evaluaciAn ncuropsicolAgica sc utilizan 
pruebas sensiblcs a la disfunciAn cerebral 
para la evaluaciAn individual. 

2. El Sislcma Nervioso Central consta de ce¬ 
rebro y mddula espinal. El Sistcma Nervio¬ 
so PerifArico incluye a los pares cranealcs 
y a la red de nervios que emanan de la m£- 
dula espinal. El cerebro estd formado de 10" 
neuronas y de un numcro todavfa mds gran¬ 
de de cdlulas glialcs que proporcionan apo- 
yo cstructural. 


3. La parte mds baja del cerebro es el melcn- 
cdfalo, que conticne al bulbo raqufdco. Las 
fibras nerviosas de las partes superiores del 
cerebro atraviesan este punto y cruzan cn 
su camino a la mddula espinal. La mddula 
Asea ayuda a controlar degluciAn, vAmito, 
respiraciAn, presiAn sangufnea, inhalacidn 
y frecucncia cardiaca. 

4. La formaciAn reticular alraviesa a la mddu- 
la Asea. Nucleos especfficos dentro de la 
formaciAn reticular se proycctan a amplias 
dreas del cerebro y de ese modo ayudan a 
mediar reflejos posturales complejos y tone 
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muscular. Sc sabe quc partes dc csta cs- 
tructura conocidas como sistema reticular 
activador gobiernan la excilacidn general o 
conscicncia. 

5. Localizado dentro del mescncefalo, el 
tegmento es una cslacidn dc rclcvo para fi- 
bras sensoriales y motoras, y tambidn con¬ 
vene muchos de los pares craneales. Los 12 
pares craneales ayudan a gobernar los prin¬ 
cipals sentidos (olfato, visidn, gusto, ofdo) 
y tambidn participan cn cl movimiento de 
rostro y lengua. 

6. Las estructuras del diencdfalo incluycn al 
tdlamo, hipotdlamo y glandula pineal. La 
funcidn de esta ultima no cs clam, aunque 
se sabe que ayuda a regular los ritmos bio- 
Idgicos efelieos a traves de la liberacidn dc 
la hormona mclatonina. 

7. El tdlamo es una estmetura importante que 
proporciona information y datos sensoriales 
a la corteza cerebral accrca del movimien¬ 
to continuo; tambidn puede participar cn la 
memoria, atencidn, habla y expericncia 
emocional, ya sea de manera directa o indi¬ 
recta a travds de su funcidn como estacidn 
dc rclevo para sitios cerebrates distantes. 

8. El hipotdlamo participa cn numerosos as- 
pectos de la conducta motivada, incluyendo 
alimentation, conducta sexual, suebo, regu- 
lacidn dc temperatura, conducta emocional 
y movimiento; tambidn controla a la gldn- 
dula hipofisaria. con lo cual modula una 
amplia variedad de funciones cndocrinas. 

9. La formation mds exterior del proscncdfalo 
cs el teiencdfalo, que incluye al Idbulo Ifm- 
bico. gangl ios basalcs, cuerpo calloso y cor¬ 
teza cerebral. El Idbulo h'mbito, incluyendo 
al Kipocampo, tabique y circunvolucidn 
cingulada. participa en la regulacidn dc la 
emocidn. El hipocampo liene una funcidn 
importante cn la consolidacidn de expei ien- 
cias nuevas en recuerdos a largo plazo. 

10. Los ganglios basales, que incluyen al nd- 
cleo caudado, putamen y globo pdlido, 
ayudan a gobernar el movimiento. El mal 
de Parkinson es un trastorno degenerativo 


dc los ganglios basales quc se caracteriza 
por movimientos in voluntaries, incluyendo 
temblor; pobreza y lentitud de movimien¬ 
to, sin pardlisis; y cambios en postura y tono 
muscular. 

11. El cuerpo calloso es la comisura principal 
que sirve para integrar las funciones de 
ambos hemisferios. Mucho se ha aprendi- 
do accrca dc la funcidn cerebral a travds 
del estudio de personas con epilepsia, a 
quicncs se ha seccionado quirurgicamen- 
te el cuerpo calloso por propdsitos terapdu- 
ticos. 

12. La capa mds exterior del cerebro es la cor¬ 
teza cerebral o neocortcza. La corteza 
cerebral comprometida consta dc sitios de- 
dicados al procesamiento sensorial bdsico 
de la visidn, audicion, tacto y control mo¬ 
tor; pero su mayor parte cs corteza no com¬ 
prometida o dc asociacidn, y se utiliza 
cn el andlisis dc informacidn sensorial y cn 
la formulacidn de respuestas motoras. 

13. Los Idbulos frontales participan en la pro- 
gramacidn y regulation dc la planificacidn 
de metas, incluyendo al movimiento corpo¬ 
ral; las Idbulos parietalcs median la con- 
cicncia corporal contralateral y ayudan 
con (areas cspacialcs. Las Idbulos occipita- 
les participan en la visidn, y los temporales 
contribuyen al procesamiento auditivo, me¬ 
moria c impulsos bioldgicos como agresidn, 
temor y sexualidad. 

14. En la mayorfa de las personas, el hemisfe- 
rio cerebral izquierdo es dominantc para cl 
lenguaje. El drea dc Broca cn el Idbulo frontal 
estd al scrvicio de los componcntcs expre- 
sivos del lenguaje, mientras los componen- 
tes receptivos se median a traves del drea 
de Wernicke en el Idbulo temporal. 

15. Las funciones especializadas del hemisfe- 
rio cerebral derecho incluyen el andlisis del 
espacio geomdtrico y visual, la comprensidn 
y expresidn de emociones, el procesamien¬ 
to de la musica y dc sonidos ambienlales 
no vcrbales, y el rcconocimiento tdctil de 
formas complejas. 
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16. Sc pucdcn utilizar varias pruebas clfnicas y 
teenicas de imagenologfa del cerebro para 
ayudar a diagnosticar los padccimicntos neu- 
roldgicos. Estos m£todos incluyen al EEG, 

HlfeMINOS Y CONCEPTOS CLAVE 


Ncuropsicologfa p. 364 

Ventrfculos p. 366 

Metenclfalo p. 366 

Mddula 6sea p. 366 

Formacidn reticular p. 367 

Cerebelo p. 367 

Mesencifalo p. 368 

Pares craneales p. 369 

Prosencdfalo p. 369 

Glfindula pineal p. 369 

Tdlamo p. 369 

Hipotilamo p. 370 


artcriograffa cerebral, tomograffa computa- 
rizada, tomograffa por emisidn de positro- 
ties, imagenologfa porresonancia magn&ica 
y angiograffa por resonancia magndtica. 


Lobulo Ifmbico 

p. 370 

Hipocampo 

p. 370 

Ganglios basales 

p. 371 

Mai de Parkinson 

p. 371 

Cuerpo calloso 

p. 371 

Cortcza cerebral 

p. 372 

Ldbulos occipitales 

p. 375 

Agnosia visual 

p. 375 

Ldbulos parictales 

p. 376 

Ldbulos tcmporales 

p. 377 

Ldbulos Iron tales 

p. 378 

Dispraxia de construccidn 

p. 385 
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Las pruebas y procedimientos neuropsi- 
colOgicos engloban una variedad ecldctica de 
mdtodos y propdsitos. En un extremo del es- 
pectro sc cncucntran las pruebas scncillas, de 
detecciOn, con duracidn de 10 minutos, que sc 
utilizan para sondear la necesidad de una ma¬ 
yor evaluacidn. En cl otro extremo cstdn las ba- 
(erfas exhausii vas, de seis boras, diseriadas para 
proporcionar una evaluacidn completa. Entre 
estos dos punios se encuentran miles de instro- 
menios especializados que se han desarrollado 
para medir capacidadcs neuropsicoldgicas par- 
ticulares, los cuales a primera vista parecerfan 
resistir la categorizaci6n simple, como si los 


investigadorcs en csta drea hubieran seguido una 
filosoffa incoherente, al tanteo, en el dcsarrollo 
de nuevos instrumentos y procedimientos. No 
obstante, en un escrutinio mds completo se hace 
cvidcnlc que la mayor parte de las pruebas 
neuropsicoldgicas encajan dentro de un modc- 
lo simple y Idgico de relaciones cerebro-con¬ 
ducta. que sc utilizard como esquema para cl 
andlisis de las pruebas y procedimientos 
neuropsicologicos mds conocidos. 

La evaluacidn ncuropsicoldgica implica mas 
que la aplicacidn y calificacidn de pruebas es- 
pecializadas. Un componente importante de 
cualquier evaluacidn es la valoracidn del estado 
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mental del cliente. Estoes particularmcntecierto 
en el caso de clicntes ancianos que pueden pre- 
sentar enfertnedad de Alzheimer u otras for¬ 
mas dc demencia. De acuerdo con esto, se 
cierra el capfiulo enfalizando la cvaluacidn del 
estado mental cn las ancianos. 


I UN MODELO CONCEPTUAL 
DE LAS RELACIONES 
CEREBRO-CONPUCTA 


Bennett (1988) ha propucsto un modclo sim- 
plificado dc rclacioncs ccrcbro-conducta util 
para organizar la profusidn aparcntcmcntc 
cadtica de pruebas neuropsicoldgicas (figura 
9-6). Su concepto es una pcquena expansion 
del modclo presentado por Rcitan y Wolfson 
(1993). Segun este punlo de vista, cada prue- 
ba o procedimiento neuropsicoldgico valora 
una o mas dc las siguientes categories: 

1. Entrada sensorial 

2. Atcncidn y conccntracidn 

3. Aprcndizaje y memoria 

4. Lenguajc 

5. Capacidad espacial y de manipulacidn 

6. Funcioncs cjccutivas: 

Andlisis Idgico 
Formacidn de conceptos 
Razonamiento 
Planificacidn 

Flexibilidad de pensamiento 

7. Salida motora 

El orden de las categorfas listadas corrcspondc 
aproximadamente al orden en que el ccrcbro 
analiza la informacidn que ingresa para una res- 
puesta o salida motora. 

En lo que resta de este tema, cl examen de 
las pruebas y proccdimientos ncuropsicoldgicos 
se organiza alrededor de estas siete catego¬ 
rfas. Dentro de cada una, se revisardn las prue¬ 
bas cstablecidas y se presentardn nuevos ins- 
trumentos que prometen ampliar los horizontes 



Figura 9-6. Modeto conceptual de las rolaciones cerebro- 
conducta. 

Fuente: Basado en Reltan y Woltson (1993) y repnodu- 
cido con autorizacWn de Bennett, T. (1988). Use ol the 
Halstead-Reitan Neuropsychological Test Battery in the 
assessment ol head Injury. Cognitive Rehabilitation 6, 
18-25. 

de la evaluacidn neuropsicoldgica. Sin embar¬ 
go, el lector neccsita conocer que, por lo gene¬ 
ral, la cvaluacidn ncuropsicoldgica implica una 
baterfa dc pruebas. Un enfoque es cl examen 
flexible o centrado cn cl pacicntc en el que se 
disefta una baterfa individualizada de pruebas 
para cada uno. Estas balerfas se basan en la 
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dolencia exhibida, cn cucstioncs de canaliza- 
ci6n y en una evaluacidn initial (Goodglass, 
1986 : Kane, 1991). No obstante, es mds comun 
que los ncuropsicologos empleen una baterfa fija 
de pruebas para la mayorfa de las personas ca- 
naliz-adas; en el cuadro 9-7 se describe una dc 
las rnds usadas, la Halstead Reitan Neuropsy¬ 
chological Battery (Baterfa Neuropsicoldgica 
Halstcad-Rcitan). El capftulo se cicrra con otra 
conocida baterfa fija, la Luria-Nebraska 
Neuropsychological Battery (Diagndstico 
Ncuropsicoldgico Luria-Nebraska). 


| | EVALUACION DE LA ENTRADA 
* SENSORIAL 


La precisidn de la entrada sensorial es funda¬ 
mental para la suficiencia de la pcrccpcidn, 
pensamiento, planes y accidn. Un individuoque 
no vea los cstfmulos de mancra corrccta, escu- 
chc los sonidos con precision o procese cl tacto 
de modoconfiable, puede enfrentar impedimen- 
tos adicionales en los nivclcs mris altos de la 
perccpcidn y cognicidn. La cvaluacidn neuro- 
psicoldgica siempre incorpora un examen 
multimodal de las capacidadcs sensoriales. 

EXAMEN SENSOPERCEPTUAl 

Los proccdimientos que desarrollaron Reitan y 
Klove son tfpicos de los procedimientos senso- 
perceptuales (Reitan, 1984, 1985). El Reitan- 
Klove Sensory-Perceptual Examination (Exa¬ 
men Scnsoperceptual Rcitan-Klove) consta de 
varios mdtodos para presentar cstfmulos unila- 
tcrales y bilaterales en las modalidades de lac- 
to, ofdo y visidn. Las (areas son tan sencillas 
que las personas normales pocas veces come- 
ten algtin error. Por ejemplo, se lc pide a la per¬ 
sona evaluada que diga cual mano se le ha 
tocado (con los ojos cerrados), o que informe 
cu£l ofdo ha recibido un chasquido de dedos 
apenas audible o que identifique cudl numero 
sc ha delineado sobre la yema del dedo. Los 
rcsultados dc esta prueba son particularmente 


diagndsticos si la persona comcte mis errorcs 
de un lado del cuerpo que del otro. El lector 
recordara del capftulo anterior que la inervacidn 
neuronal es casi exclusivamcnte contralateral. 
Lo que es mds, ciertas dreas de la cortcza cere¬ 
bral sc dedican al procesamiento primario del 
tacto, ofdo y visidn. Asf, una persona que ten- 
ga dificultad para proccsar el tacto en la mano 
derccha, puede tener una lesidn en la circunvo- 
lucidn poscentral del Ibbulo parietal izquierdo. 
Dc mancra similar, la dificultad para proccsar 
cl sonido en cl ofdo derecho, puede indicar una 
lesidn cn la parte superior del Idbulo temporal 
izquierdo, y los defectos visualcs en el lado 
derecho pueden indicar daiio cerebral cn el 16- 
bulo occipital izquierdo. 

PRUEBA DE LOCALIZACI6N DE DEDOS 

La Finger Localization Test (Prueba de Local i- 
zacidn de Dedos) es un proccdimiento que de¬ 
sarrollaron los neur6logos para valorar posibles 
pcrdidas sensoriales producidas por deterioro 
dc las funcioncs ccrebrales. La mayor parte de 
las baterfas dc pruebas ncuropsicologicas em- 
plean una variante de esta prueba, cn la que las 
personas evaluadas deben identiftcar los dedos 
que se les han tocado (sin ver). Benton ha dc- 
sarrollado una prueba bicn normada de 60 
reactivos de localizacidn de dedos queconsistc 
en tres partes: 1) con la mano visible se identi- 
fican dedos individualcs que ha tocado cl exa- 
minador con la punta de un 14piz (10 ensayos 
con cada mano); 2) con la mano oculta dc la 
vista, sc idcntifican los dedos individuates que 
ha tocado cl examinador (10 ensayos con cada 
mano); 3) con la mano oculta de la vista, se 
identifican pares de dedos tocados de manera 
simultanca por cl examinador (10 ensayos cn 
cada mano). El mdtodo de respuesta se deja al 
paciente; nombrar, tocar o sehalar los dedos en 
un diagrama (Benton, Sivan, Hamsher, Varney 
y Spreen, 1994). Cada prescntacidn de un es- 
tfmulo se califica como correcto o incorreclo 
y, por lo comun, los adultos sanos comclcn 
muy pocos errores cn los 60 ensayos. Las pun- 
tuaciones medias para estos adultos son casi 
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Cuadro 9-7. Bateria de pruebas Halstead-Reitan 
(Tests and Procedures of the Halstead-Reitan Test Battery) 


Prueba 

Prueba de categories': 


Prueba de desempeho tdctil': 


Descripcion _ 

Mide razonamlento abslracto y formacidn de conceptos; 

requiere que la persona evaluada encuentre la regia para 
categorizar dibujos de formas geomdtricas. 

Mide capacidad cinestdsica y sensoriomotora; requiere que 
la persona con los ojos vendados coloque los cubos en 
un orificio con el code adecuado en un lablero vertical con 
la mano dominante, luego con la no dominante y despuds 
con ambas manos; tambidn evalua la memoria Incidental 
de los cubos. 


Prueba de perception de sonldos 
del lenguaje': 

Prueba ritmica Seashore': 


Pmeba de golpeteo con los dados': 


Fortaleza de asimiento: 


Trazado de un camlrro. partes A. B: 


Reconotimiento tactil de formas: 


Mide atencidn y slntesis audiovisual; requiere que la 
persona elija entre cuatro opciones la version escrita de 
palabras sin sentido mostradas en cinta de audio. 

Mide alencibn y percepcidn auditiva; requiere que la perso¬ 
na evaluada indique si un par de rilmos musicales son 
iguales o diferentes. 

Mide velocidad motora; requiere que el individuo golpelee 
una palanca pareclda a la tecla de un teldgrafo con la ma¬ 
yor rapidez posible durante 10 segundos. 

Mide fortaleza de asimiento con un dinamdmetro; requiere 
que la persona evaluada apriete con la mayor fuerza po¬ 
sible; hay ensayos separados con cada mano. 

Mide capacidad de rastreo, flexibilidad mental y velocidad; 
requiere que la persona conecte numero (parte A) o mime- 
ros y letras en orden alternanle (parte B) con una linea de 
Idpiz, bajo presidn de tiempo. 

Mide capacidad sensoperceptual; requiere que la persona 
evaluada reconozca formas senclllas (p. ej.. tridngulo) 
colocado en la palma de la mano. 


Examen sensoperceptual: 


Mide capacidad sensoperceptual; requiere que la persona 
responds a tareas sensoriales bilalerales simples; por 
ejemplo, detectar cudl dedo se le ha tocado, cudl oido ha 
recibido un sonido breve; evalua los campos visuales. 


Prueba de detection de la afasia: 


Mide capacidades expresivas y receplivas del lenguaje; 
las tareas incluyen nombrar un articulo reprosentado en 
una IlustracWn (p. ej.. tenedor). repetition de frases codas; 
se incluyen tareas de copiado (no es una medida de la 
afasia) debido a razones histdricas. 


Complementaria 


WAIS-lll. WRAT-3, MMPI-2, pruebas de memoria como la 
Escala Wechsler de Memoria-lll o la Rey Auditory Verba 
Learning Test. 


• En estnclos. eslas c^o med.das consign H al »,e a d.R 8 .tan No obsUnle. on un sen.Kto « 

rolerencia cotid*ana. la Hatstead-Reiian induye lodas las med*das itsladas antes 
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pcrfcctas, y van desde 56 hasta 60 cn varias 
muestras. En contraste, aqudllos con padeci- 
mientos cercbralcs cnfrenlan un desaffo en la 
localizacidn de dcdos, cn particular en la sc- 
gunda y tercera partes de la prueba. 

MEDIDAS DE ATENCI6N 

|^yconcentraci6n 


La capacidad de atencidn del cerebro hace po- 
siblc atender a estfmulos significativos, sepa- 
rar la entrada sensorial irrclcvante de la 
profusibn dc estfmulos que ingresan y cam- 
biar a estfmulos altcrnativos cuando las condi- 
cioncs lodemandan (Kinsboume, 1994). Aunque 
cn teorfa scrfa posiblc haccr distinciones sull¬ 
ies cntre atcncion simple, conccntracidn, viraje 
mental, rastreo mental, vigilancia y otras va- 
riedadcs dc atencidn/concentracidn. en la prdc- 
tica es diffcil separar cstas habilidadcs. S6lo 
una medida de atencidn —la Test of Everyday 
Attention, TEA (Prueba de Atencidn Cotidia- 
na)— ha tenido dxito en dividir la atencidn en 
sus fuentes componentes. En las siguientes scc- 
ciones se analiza la TEA y otras notables medi- 
das de deterioro en la atencidn. 

PRUEBA DE ATEN06N COT1DIANA 

La Test of Everyday Attention, TEA (Prueba de 
Atencidn Cotidiana), es una medida promete- 
dora que disenaron en Gran Brclafia Robertson, 
Ward. Ridgeway y NimmoSmith (1994, 1996); 
nude los subcomponentcs de la atenci6n, in- 
cluyendo atencidn sostenida. selcctiva, dividida 
y cambio de atencidn. En el cuadro 9-8 sc 
describcn las subpruebas de la TEA. La prueba 
tiene tres vcrsioncs paralelas que se han valida- 
do de manera adccuada con clientes que han 
sufrido lesiones cefdlicas cerradas, pacien- 
tes con accidentes cerebrovasculares y perso¬ 
nas con enfermedad de Alzheimer. Los datos 
normativos se basan en cl desempeno de 154 
indi viduos sanos entre los 18 y 80 ados de edad. 
Las personas evaluadas disfrutan de los esce- 
narios de la vida real dc la TEA, lo cual sc ana- 


Cuadro 9-8. Subpruebas de la 
Prueba de atencion cotidiana (TEA) 

Busqueda do mapa: una busqueda cronometrada 
de dos minutos de 80 sfmbolos en un mapa de 
colores; mide atencidn selectiva. 

Cuenta de ascensor: simulation de una cuenla 
de los pisos en el ascensor con tonos presentados 
en cinta de audio; mide atencidn sostenida. 
Cuenta de ascensor con distraction: igual que la 
anterior, pero con distracciones auditivas; mide 
atencidn sostenida. 

Ascensor visual: simulacion visual de la cuenta 
de los pisos en el ascensor con inversiones hacia 
arriba-hacia abajo; mide cambio de atencibn. 
Ascensor auditivo con inversidn: igual que el as¬ 
censor visual, excepto que se presents en cinta 
de audio; mide cambio de atencibn. 

Busqueda telefdnlca: busqueda de sfmbolos clave 
al mismo tlempo que se buscan los registros en 
un directorio telefdnico simulado de anuncios 
clasilicados; mide atencidn dividida. 

Tarea dual de busqueda teleldnica: comblna la 
Busqueda teleldnica con la cuenta simultdnea de 
tonos auditivos; mide atencidn dividida. 

Loteria: el individuo escucha los numeros gana- 
dores en busca de aquellos que terminan en 55 y 
despuds escribe los estimulos anteriores; mide 
atencidn sostenida. 


dc a la validcz ccoldgica del instrumento. Esta 
prueba es sumamente sensible a los efcctos nor- 
males debidos a la edad en la poblacibn general 
y, por tanto, es muy adecuada para la evalua- 
cidn gcridtrica. Con cxcepcidn de la subprueba 
de Cuenta de Ascensor, las ocho subpruebas sc 
estandarizaron para producir puntuaciones equi- 
valcntcs con una media cornun de 10 y desvia- 
cidn estandar dc 3. Asf, la TEA permite el 
anblisis de subprueba como medio para identi- 
Hear las fortalezas y debilidades particulars de 
un individuo (Crawford, Sommerville y 
Robertson, 1997). 

PRUEBA DE DESEMPENO CONT1NUO 

La Continuous Performance Test, CPT (Prue¬ 
ba de Desempeno Continuo), no es en realidad 
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una sola prueba, sino mds bien una familia de 
proccdimicnios similares que proviene dc la in- 
vcstigacidn Ifdcr de Rosvold, Mirsky, Sarason 
y colaboradores (1956). Estos autores discna- 
ron una medida de atcncidn sostenida (liamada 
lambidn vigilancia) que implicaba la presenta¬ 
tion continua dc Ictras sobre una pantalla. En 
algunos casos, las personas cvaluadas tcnfan 
que presionar una tecla cuando aparccfan cier- 
tas letras (p. ej.. jc); cn otros, los individuos te- 
rn'an que presionar una tecla cuando cicrta Iclra 
apareefa despuds de otra (p. cj., la x cuando 
ocurn'a despuds de la a). Los errores de omisi6n 
son aqudllos cn los que la persona no presiona 
la tecla al presentarse el estfmulo bianco. Los 
errores de comisidn son aquellos que rcaliza el 
individuo cuando presiona la tecla al presen- 
tarsc un estfmulo no bianco. Las personas sa- 
nas cometen pocos errores. El mdtodo ha 
resultado espccialmcnte eficaz en la idcntifica- 
ci6n dc trastomos por dafio cerebral que inclu- 
ycn hiperactividad, efectos dc las drogas, 
esquizofrenia y dafio cerebral explfcito 
(Huhtaniemi, Haier, Fedio y Buchsbaum, 1983; 
Sostek, Buchsbaum y Rapoport, 1980). 

La CPT es ideal para la adaptacidn a 
computadora y en la litcratura han aparecido 
doccuas dc diferentes vcrsioncs dc clla (p. ej., 
Buchsbaum y Sostek, 1980; Gordon y Mettelman, 
1988). Por desgracia, la prolifcracidn de pruebas 
similares, pero no identicas, ha obstaculizado 
la invcstigacidn acerca de la utilidad practica 
dc esta prometedora medida dc la atcncidn. Re- 
cicntcmente, Sandford y Turner (1997) publi- 
caron una CPT por computadora que emplea 
tanto estfmulos visuales como auditivos. Las 
normas de la Intermediate Visual and Auditory 
Continuous Performance Test, 1VA (Prueba Vi¬ 
sual y Auditiva Intermedia del Dcsemperfo Con- 
tinuo), se establecieron con 781 personas 
normales cuyas edades iban dc 5 a 90 afios y 
evaluadas para detectar ddficit dc atcncidn, difi- 
cultades de aprendizaje. problemas cmociona- 
les y uso de medicamcntos. En un andlisis, la 
IVA mostrd 92% de sensibilidad (es deeir, una 
tasa de 8% dc falsos negativos) y 90% de espe- 
cificidad (es deeir una tasa de 10% de falsos 
positivos) cn cuanto a diferenciar a ninos con 


un diagndstico dc Trastorno por Ddficit dc 
Atencidn con Hiperactividad (TDAH) dc ninos 
sanos. Este instrumento es s6lo una de las mu- 
chas pruebas ncuropsicoldgicas prometedoras 
que toma ventaja dc la tecnologfa de las 
microcomputadoras. 

TAREA R1TMICA AUDITIVA DE SUMA 
EN SERIE 

Si se considera su absoluta sencillez, la Paced 
Auditory Serial Addition Task, PASAT (Tarca 
Rftmica Auditiva de Suma en Scrie), es un fn- 
dice extremadamente sensible del rastreo men¬ 
tal (Gronwall y Wrightson, 1974; Gronwall y 
Sampson, 1974). La persona evaluada cscucha 
una serie de dfgitos que se presentan en cinta 
de audio y suma cada par succsivo de dfgitos. 
Asf, si los numcros que se presentan son “3-1- 
9-5-4”. el individuo deberfa responder "4-10- 
14-9". 

La PASAT comicnza con una serie de prdc- 
tica de 10 dfgitos, donde cada numcro nuevo 
se presenta cada 2.4 segundos. La prueba cn sf 
consiste en 61 estfmulos (lo cual requiere 60 
sumas) en cada una dc cuatro velocidades de 
prescntacidn: 2.4,2.0, 1.6 y 1.2 segundos entre 
dfgitos. A travds del cdlculo del porcentaje co- 
rrccto en cada una dc las tasas de presentacidn, 
cl examinador obtiene cuatro puntuaciones cn 
la PASAT. 

Aunque el formato de la PASAT es sim¬ 
ple, las demandas de procesamicnto dc infor- 
macidn dc esta prueba son un tanto arduas. A 
fin de tener un desempefio adecuado, la perso¬ 
na examinada debe conservar dos numeros cn 
la memoria a corto plazo, llevar a cabo una suma 
mental, deeir la respuesta, retener en la memo¬ 
ria a corto plazo s61o el ultimo de los dos nu¬ 
meros, anexar el ultimo dfgito a la memoria a 
corto plazo y despuds comenzar el ciclo dc nue¬ 
vo. Las personas con detcrioro cn las funcioncs 
ccrebralcs encontraran que este malabarismo 
mental es cognitivamentc abrumador. 

Gronwall recomienda la PASAT para la 
evaluacidn cn serie de pacientes con conmo- 
cidn cerebral (Gronwall, 1977; Gronwall y 




VVrightson, 1981). Definida de mancra breve, 
la conmocion cerebral es una alteracidn tran- 
sitoria de la conciencia dcbido a un golpc cn la 
cabcza, a la que le pucdc seguir amnesia tem¬ 
poral, mareo, nauseas, pulso ddbil y rcspiracion 
jenta, no obstante, no existe un dafio cerebral 
orgtfnieo demostrablc (McMordic, 1988). La 
PASAT tiene amplio rcconocimienlo como un 
jnslrumcnto muy sensible a los efcctos de la con- 
mocidn cerebral (Stuss, Stethem, Hugcnholtz 
y Richard, 1989). Sin embargo, una cuestidn 
crucial de bsta es cutinto deberfa tardar cl pa- 
ciente cn recuperarse. Cuando las punluacio- 
ncs sucesivas en la PASAT regresan finalmentc 
ill rango normal —lo cual podn'a tomar varios 
dfas o semanas— cl tcrapeuta puedc tener ma¬ 
yor confianza en que cl pacicnte estd listo para 
regresar al trabajo. 

En gran medida debido a una fundamenta- 
cidn humanista, Lczak (1995) advierte en contra 
del uso rutinario de la PASAT. En su experien- 
cia, incluso las personas totalmcnte cognitivas 
intactas sienten que la prueba es muy cstrcsnnte 
y piensan que sus respuestas son incorrectas, 
aunque su desempeno sea normal. Dado que 
existen modos mds fdcilcs de demostrar el dc- 
tcrioro cn la atencidn, csta autora recomienda 
cl uso de la PASAT sdlo en circunstancias es- 
peciales: 
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Subtracting Serial Sevens (Resta de Series de 
Siete) (Strub y Black, 1985). Se le pide ai 
examinando que “reste siete de 100", cuando 
termina sc le dice "ahora reste 7 de 93 y siga 
rcstando sietes hasta que ya no pueda continuar 
mds”. El examinador registru cl numcro de rcs- 
tas individuates incorrectas y tambidn puede dar 
punluaciones al tiempo que se requiere y las 
pausas mayores a cinco segundos. 

Smith (1967) ha informado sobrc uno de 
los cstudios normativos sobre la Resta de Se¬ 
ries de Siete. Este autor evaluo a 132 cmplca- 
dos adultos, la mayorfa con tftulos universitarios 
o profesionalcs. S6lo 2% de su muestra no pudo 
terminar la prueba, mientras otro 5% comet in 
mds de cinco errores. Las mujeres estaban mds 
propensas a los errores que las varones, cn par¬ 
ticular mujeres mayores de 45 anos, sin educa- 
cidn universitaria. Asf, los examinadores no 
deben sobreinterpretar los problcmas mcnorcs 
con la Resta de Series de Siete. Por otro lado, 
el desempeno gravemente defectuoso —una 
incapacidad para proseguir, tasa muy elevada 
de errores o restas muy lentas— es caracterfsti- 
co de individuos con daho cerebral. 


MEDiDAS ADICIONALES Da DETERIORO 
EN LA ATENC16N 


... I n tango disponible para esas ocasiones en 
que es necesario hacer obvias las deficlencias 
sutilos en atencibn a los escbpticos mbs retro¬ 
grades, con algun propbsilo que en mucho esti 
en boneficio del paciente; y onlonces preparo de 
antemano a estos pacientes, hacidndoles saber 
que puede ser un procedimlento desagradabto 
y quo pueden sentlr que van lallando aunque no 
sea ast. 

En un campo donde las pruebas sc justiftcan 
principalmente con base cn las tasas de acierto 
y cosas similares, su perspectiva centrada en el 
paciente es buena. 

RESTA DE SERIES DE SIETE 

L’na tarea bien conocida que se incluye con fre- 
cuencia cn el examen del cstado mental es la 



Muchas de las pruebas disefiadas para otros 
propositos posecn un fuerte factor asociado con 
la atencidn. Las subpruebas de Retcncidn de 
Dfgitos y Aritmblicn de las escalas Wcchsler 
de inteligcncia tienen reconocimiento como 
buenos indices de atcncidn auditiva inmediata. 
Las subpruebas de Claves o Sfmbolos y Digitos 
tambibn tienen fuertes cargas factorialcs en el 
factor de libertad de la distractibilidad. 

Smith (1968, 1973) ha disehado una intc- 
resante extensidn de la subprueba de Dfgitos y 
Sfmbolos de Wechsler, conocida como Symbol 
Digit Modalities Test, SDMT (Prueba de Mo- 
dalidades de Sfmbolos y Dfgitos). En esta prue¬ 
ba. los sfmbolos estdn impresos cn una pagina 
y la persona evaluada escribe debajo de cllos 
los numeros correspondientes (figura 9-7). Con 
este formato, el examinador puede aplicar 
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Figure 9-7. Prueba de rnodalldades de s/mbolos y digitos. 

Fuente: Reproducido con autorlzacidn de Smilh, A. (1973). Symbol Digit Modalities Test Manual. Los Angeles: 
Western Psychological Services. Copyright del material de la Symbol Digit Modalities Test © 1973 de Western 
Psychological Services. Reproducido con autorizaciPn del editor, Western Psychological Services, 12031 Wilshlre 
Boulevard, Los Angeles, California 90025, Estados Unidos de Norteambrica. 


tanto un cnsayo cscrito como uno oral, lo cual 
ayuda a aislar la fuente de dificultad con la ta- 
rea de sustitucidn. Por cjcmplo, una persona 
que presenta un dctcrioro normativo en la parte 
cscrita, pero cuyo desempeno es superior al 
promedio cn la parte oral, podrta sufrir detcrio- 
ro en el control motor. La correlacidn entre las 
puntuacioncs de la SDMT y de Digitos y Sim- 
bolos es sumamente elevada (r = .91), pero la 
SDMT produce puntuaciones que son compa- 
rativamente tnferiores a las de Digitos y Sim- 
bolos (Morgan y Whcclock, 1992). 

Varias pruebas de la bateria Halstead-Reitan 
son buenas medidas de atencidn (Bennett, 1988). 
En la Speech Sounds Perception Test ; SSPT 
(Prueba de Pcrcepcidn de Sonidos del Habla), 
la persona evaluada debe elegir entre cuatro 
opciones la versidn escrila de palabras graba- 
das que no tiene sentido. Porejemplo, la voz cn 
la cinta podria deeir “frip”, niientras que la per¬ 
sona evaluada debe leer las cuatro opciones y 
subrayar la altemativa correcta: 

Frib, flib, frip. flip. 

La SSFI' es sumamente sensible a los deterio- 
ros en la atencidn que provienen de cualquicr 
tipo de dado cerebral. La Seashore Rythym Test 
(Prueba Ritmica Seashore), que originalmente 
era una prueba de aptitud musical en la que 
deben compararse pares de ritmos musicales, 
tambidn rcsulta depender en gran medida de los 


proccsos de atencidn. La Trail Making Test 
(Prueba de Trazado de un Camino), partes A y 
B, tambidn es sensible al dclerioro en la aten¬ 
cidn. Shum, McFarland y Bain (1990) analizan 
pruebas adicionales de atencidn. 

PRUEBAS DE APRENDIZAJE 
Y MEMORIA 


El aprendizaje y la memoria son proccsos en- 
trelazados diffeiles de analizar de manera ais- 
lada. En general, el aprendizaje de material 
novedoso requierc del ejcrcicio de la memoria. 
Lo que es mds. muchas pruebas de memoria in- 
corporan una curva de aprendizaje a (raves de 
aplicaciones repetidas. La separaci6n de los pro- 
cesos de aprendizaje y memoria es tedricamen- 
tc posible, pero es de poco valor prdctico en la 
evaluacidn clinica. En nuestro caso no se reali- 
za una estrecha distincidn entre estos procesos. 

Las pruebas de memoria pueden clasift- 
carse segun varias dimensiones que incluyen 
corto plazo contra largo plazo, verbal contra 
pictdrica y de curva de aprendizaje contra sin 
curva de aprendizaje. Estas dimensiones refle- 
jan los factores neuroldgicos que se examinan 
en la seccion anterior. Porejemplo, la memoria 
verbal cstd significativamcntc latcralizada ha- 
cia el hemisferio izquierdo, mientras la memo- 
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r ja pictorica se sirve en gran medida del hcmis- 
ferio derccho. El lector interesado puede con- 
sultar a Lezak (1995) y Reeves y Wedding 
(1994) para andlisis mas detallados de los 
sustratos ncuronalcs dc los diferentes tipos de 
memoria. Aquf se centrard la atcncidn en las 
caractcrfsticas psicometricas de cuatro praebas 
bastante diferentes de la memoria. 

escala wechsler de memoria-iii 

La Wechsler Memory Scale-Ill, WMS-III (Es¬ 
cala Wechsler dc Mcmoria-iri; Tulsky, Zhu y 
Ledbetter. 1997), es una revisidn sustancial dc 
una prueba sencilla de una pdgina que se pu- 
blied hacc mds dc 50 afios (Wechsler, 1945). 
La tercera edicidn cs una prueba extensa y 
multifdsica de la memoria que consta de 17 
subpruebas, incluyendo siete opcionales. Las 
10 subpruebas principals se describen en el 
cuadro 9-9; constituyen la base para las pun- 
tuaciones escalares obtenidas con ajustc por 
edad (media de 100 y DE de 15) para ocho In¬ 
dices primarios de memoria: 


Cuadro 9-9. Escala Wechsler de 
Memoria-lll Subpruebas principales 


Subpruebas de recuerdo inmediato 

Memoria kigica /: recuerdo de elementos esenciales 
de historias breves leidas a la persona evaluada. 
Roslros I: recuerdo de si-no de 24 rostros bianco 
presentados cada uno durante dos segundos. 
Pares verbales asotiados I: recuerdo de una lista 
de tdrmlnos apareados (p. ej., camion-flecha) 
cuando solo se presenta el primer tdrmino (p. ej., 
camidn-?). 

Relratos de lamilia I: recuerdo de la localizacidn y 
actividades de personas representadas en 
llustraciones de escenas familiares. 

Secuencias de lelras y numeros-. reordenacidn de 
digitos y letras distribuidas de manera aleatoria 
de modo que ambos se encuentren en orden 
correcto (p. ej., ”7, x, d. s, 4, 2" se ordenan como 
“2. 4, 7. d, s. x). 

Retencidn espacial : un andlogo visual de 
Retencidn de digitos en el que cubos numerados 
se colocan en un orden particular; la persona 
evaluada debe llevar a cabo tanto la serie en 
sentido progresivo como en sentido inverso. 


Auditiva inmediata 
Visual inmediata 
Memoria inmediata 

Memoria general 


Auditiva demorada 
Visual demorada 
Reconocimiento audi- 
tivo demorado 
Memoria simultdnea 


Subpruebas de recuerdo demorado* 

Memoria Ibgica II 
Rostros II 

Pares verbales asociados II 
Relratos de familia II 


Las normas de la WMS-III se establccicron jun¬ 
to con las del WAIS-III en 1997. La estan- 
darizacidn del nuevo instrumento es espldndida, 
con 200 casos seleccionados para cada una dc 
estas bandas por edad: 16 a 17, 18 a 19, 20 a 
24, 25 a 29, 30 a 34, 35 a 44. 45 a 54. 55 a 64. 
65 a 69. 70 a 74, 75 a 79. Para las dos bandas 
de mayor edad (80 a 84, 85 a 89) se incluycron 
150 y 100 casos. respectivamente. Con base en 
las datos del ccnso de 1995, los participantes 
de la muestra de cstandarizacidn se estrati- 
ficaron de manera cuidadosa en cuanto a edad, 
.’Cxo, raza/origen etnico, nivel educativo y re- 
gi6n geogrdfica. 

Los estudios de validez de la WMS-III son 
sumamente positivos, aunque la investigacidn 


’ Recuerdo demorado de los estlmulos de la primers apUcacttn 
despuds de 30 minulos 

analftico factorial no siempre sustenta el andli¬ 
sis designado en los diversos aspectos de me¬ 
moria que sc citan antes. La evidencia mds 
poderosa de la validez es que el instrumento 
ticnc un funcionamienlo adecuado en la detec¬ 
tion dc deficicncias dc memoria. En las estudios 
iniciales de validacidn (Tulsky, Zhu y Ledbetter, 
1997), se observd que los grupos clinicos con 
trastomos neuroldgicos (p. ej., enfermedad de 
Alzheimer, lesitin traumdtica cefdlica) tuvicron 
puntuaciones significativamente mas bajas en 
los ocho indices primarios de la WMS-III. Por 
ejemplo, una muestra de 35 individuos con 
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probables etapas iniciales dc la cnfcrmcdad dc 
Alzheimer obluvicron puntuaciones promedio 
a la mitad o parte superior del rango de 60 pun- 
tos en 6 de los 8 Indices. Esto cs de especial 
importancia debido a que la dcficiencia cn la 
memoria es la afeccidn inicial en lu progresidn 
de la enfermedad de Alzheimer. 

La invcstigacidn de validez con la WMS-III 
es cscasa cn estc momento. No obstante, la ul¬ 
tima edicion conserva los aspectos cscncialcs 
de su antecesora, la WMS-R, para la cual sc 
encuentra disponible gran cantidad dc inves- 
tigacidn sobre validez. Por ejcmplo, Ryan y 
Lewis (1988) cncontraron dcficicncias sustan- 
ciales de memoria en alcohdlicos que habfan 
atravesado recientemente por un proceso de 
dcsintoxicacidn. Este es un dato importante, ya 
que los cstudios clfnicos con la WMS original 
no rcvelaron dcficiencias de memoria en alco- 
hdlicos, lo cual haefa que los investigadores 
dudaran de la validez dc la primera edicidn. La 
WMS-R tambidn t'unciona bien en la identifi- 
cacidn de deficiencias ncuropsicoldgicas pro- 
ducidas por lesiones cefrilicas cerradas (Reid y 
Kelly, 1993). En una conclusidn relacionada, 
Mittenberg, Azrin, Millsaps y Hcilbronncr 
(1993) encontraron que los individuos que in- 
tentan simular los sintomas de lesion cefdlica 
en la WMS-R, produccn un patrdn de puntua¬ 
ciones que puede diferenciarse de aquel de per¬ 
sonas con un verdadcro caso dc estc tipo dc 
lesidn. Esta es una conclusidn importante, de¬ 
bido a que, cn general, la precisidn de los re- 
sultados de prueba se pone en duda cuando las 
personas con lesidn cefdlica inician deman- 
das por danos o compensacidn en cl trabajo. 
La WMS-R tambidn revela las deficiencias 
esperadas en la memoria cn pacicntcs con es- 
quizofrenia, lo cual sustenta la validez de la 
prueba (Gold, Randolph, Carpenter y cols., 
1992). 

PRUEBA REY DE APRENDIZAJE 
AUDITIVO VERBAL 

Esta medida corta y dc fAcil aplicacidn de la 
memoria y aprendizaje verbales aparccid ini- 


cialmente en francos (Rcy, 1964), pero Lezijj 
(1983, 1995) y otros investigadores han pro. 
porcionado una adaptacion al ingles. Para aplicar 
la Rey Auditory Verbal Learning Test, RAVLT 
(Prueba Rey dc Aprendizaje Auditivo Verbal), 
cl examinador lee una lista de 15 sustantivos 
concrctos a una velocidad de uno por segundo. 
La persona evaluada recucrda (antos como le 
sea posible, cn cualquier orden. El examinador 
lee la lista completa en una segunda ocasidn, 
advirtiendo a la persona que debe recordar to- 
das las palabras. Despuds se procede con una 
tcrcera, cuarta y quinta aplicacidn y rcmc- 
moracidn, a las que le sigue un ensayo de in- 
terferencia con una nueva lista de palabras. A 
continuacidn se evalua el recucrdo inmediato 
de la lista original (sin el bcncficio dc una nue¬ 
va prescntacidn). Por ultimo, sc incluye un en¬ 
sayo de reconocimiento en el que la persona 
evaluada debe subrayar las palabras aplicadas 
en un largo pfirrafo por escrito. La prueba pro¬ 
duce varias puntuaciones, incluyendo el nume- 
ro recordado (dc 15) para cada uno de los 
primeros cinco ensayos, el total de dstos (75 
posibles), el recuerdo inmediato despuds de que 
se lee la lista de distracci6n y despuds la pun- 
tuacidn dc reconocimiento. 

Rosenberg, Ryan y Prifilcra (1984) conclu- 
yeron que la RAVLT ticne buen desempeiio en 
la identificacidn dc pacicntes de los que sc sabe, 
segun otros criterios, que sufren dc delerioro 
en la memoria. Adcmds dc una rcduccidn ge¬ 
neral cn el desempeiio, los pacicntcs con dete- 
rioro de la memoria mostraron una tasa reducida 
dc mejorta a travds de los cinco ensayos. Las 
normas de la RAVLT para adultos pueden en- 
contrarse en Geffen, Moar, O’Hanlon, Clark y 
Geffcn (1990) y en Wiens, McMinn y Crosscn 
(1988). Las normas para mhos de 5 a 16 afios 
de edad sc proporcionan cn Bishop, Knights y 
Stoddart (1990). Ivnik, Malec, Smith y colabo- 
radores (1992) contribuyeron con normas es- 
pecfficas de edad basadas en 530 personas 
cognitivamente normales de 56 a 97 afios dc 
edad. Schmidt (1996) ha rccopilado. resumido 
y sintetizado las normas disponibles para l» 
RAVLT. 



t- 

VALORACION fuld de memoria 
de objetos 

La Fuld Object-Memory Evaluation (Valora- 
ci6n Fuld de Memoria de Objetos) es una pruc- 
ba util del deterioro de la memoria en ancianos 
(Fuld, 1977). La pnieba comienza con la prc- 
sentacion ante la persona evaluada de una bol- 
sa que contiene 10 objetos comuncs (pelota, 
botella, botdn, etc.). La tarca no se describe 
como una prueba de memoria. Sc pidc al indi- 
viduo evaluado que determine si puede identi- 
ficar los objetos sdlo con cl taclo. Se siente cada 
uno y despues se le nombra; postcriormentc la 
persona extrae el objeto de la bolsa para ver si 
estii en lo correcto. Despuds de que se han iden- 
tificado dc mancra correcta los 10 artfculos, se 
aplica una prueba de distraccidn: decir rdpida- 
mente palabras en una ealegoria semintica (p. 
ej., nombres, comidas, cosas que hacen felices 
a las personas, verduras o cosas que hacen cn- 
tristecer a las personas). A continuacidn sc pidc 
a la persona evaluada que recucrdc tantos ob¬ 
jetos como sea posible. Despuds dc cada obje¬ 
to rememorado, se le rccucrda de mancra verbal 
al sujeto. en forma lenta y clara, cada uno de 
los artfculos omitidos en esc ensayo, un proce- 
sodenominado rccordatorio selective (Buschke 
y Fuld, 1974). Despuds se aplican a la persona 
cuatro oportunidades adicionalcs de rememo- 
rar In lista a travds de rccordatorio sclcctivo, 
con una tarea de distraccidn despuds de cada 
ensayo. El recuerdo demorado se evalua des¬ 
puds de un intervalo de cinco minutos. Por ulti¬ 
mo. la prueba sc cicrra con una prueba de 
reconocimiento de opcitfn multiple. 

Es frecuente que la prueba Fuld se utilice 
para ayudar a confirmar el diagndstico de cn- 
fermediid de Alzheimer, trastomo neuroldgico 
degenerativo que se describid en el tema ante¬ 
rior. En las etapas inicialcs de esta enfermedad, 
cl sfntoma mds dcstacado es la pdrdida de me¬ 
moria. Las personas ancianas con deterioro en 
•a memoria no sdlo oblienen puntuaciones mds 
“ujns que los sujetos control en la Evaluacidn 
Fuld de memoria de objetos, sino que tambidn 
sc oencfician muy poco del recordatorio selec- 
livo. Fuld (1977) ha proporcionado normas para 
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personas en los rangos dc 70 a 90 anos, activas 
en su comunidad y residentes sanos de asilos. 
Fuld, Masur, Blau, Crystal y Aronson (1990) 
describcn un csludio prospectivo en cl que la 
Evaluacidn Fuld de memoria de objetos demos- 
trd ser prometedora como medio dc prcdiccidn 
de la demencia en ancianos cognitivamente 
normalcs. Lichtenberg, Manning, Vangel y Ross 
(1995) describcn un programs de investigacidn 
neuropsicoldgica en cl que sc utiliza la prueba 
Fuld con pacientes mddicos urbanos de edad 
avanzada. 


PRUEBAS ADICIONALES 
DE APREND1ZAJE Y MEMORIA 

Debido a las limitaciones de espacio, no puede 
hacersc mds que una mencidn breve de otras 
pmebas utiles dc aprendizaje y memoria. La 
California Verbal Learning Text (Prueba 
California dc Aprendizaje Verbal) estd disena- 
da con base en 1a AVLT dc Rey, pero propor- 
ciona software de computadora para cuanlificar 
y analizar el patrdn de resultados (Schcar y 
Craft, 1989). La Benton Visual Retention Test 
(Prueba Benton de Retencidn Visual) es una 
prueba de memoria visual con copia de disenos 
(Sivan, 1991). La Rivermead Behavioral 
Memory Test (Prueba Rivermead de memoria 
conductual) es una medida de la Memoria Coti- 
diana (p. ej.. encontrar rutas, recordar un nom- 
bre) dentro de entornos de rehabilitacidn (Koltai, 
Bowler y Shore, 1996). En Lezak (1995), 
Reeves y Wedding (1994) y Sprcen y Strauss 
(1988) pueden encontrarse buenas reseffas dc 
pruebas dc memoria. 

B evaluaci6n de las FUNOONES 
Da LENGUAJE 


Como sc scfiald en la seccidn anterior, el fun- 
cionamiento del lenguaje ofrece una ventana a 
la integridad del hemisferio cerebral izquierdo. 
Asf, los ncuropsicdlogos estdn profundamente 
interesados en la capacidad de la persona eva- 
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luada para hablar, leer, escribir y comprender 
lo que otros dicen. Provoca poca sorpresa que 
una evaluacibn neuropsicolbgica completa 
siempre incluya uno o mbs mbtodos para eva- 
luar las funciones del lenguaje. 

Los ncuropsicblogos exhiben un interbs 
particular en una variedad dc disfunciones del 
lenguaje conocidas de manera colectiva como 
afasia. En pocas palabras, la afasia es cualquicr 
dcsviacibn en cl desempeno del lenguaje pro- 
ducida por dano cerebral. En cl examen de bsta, 
un ncuropsicblogo puede utilizar cualquiera o 
lodos los siguientes tres enfoques: 1) un exa¬ 
men clfnico no estandarizado, 2) una prueba es- 
tandarizada para deteccibn o 3) una prueba 
diagnbstica completa de la afasia. En nuestra 
breve revisibn dc los mbtodos de evaluacibn de 
la afasia se proporcionarbn cjcmplos de cada 
uno de estos enfoques. 

EXAMEN CUNICO DE LA AFASIA 

Un examen clfnico de la afasia tiene las venta- 
jas de la sencillez, flexibilidad y brevedad. Es¬ 
tos son atributos importantes cuando se 
examina a pacicntcs con deterioro grave que 
pueden requerir evaluacibn en su lecho dc en- 
fermos. Todo profesional tiene una versibn di- 
ferente del examen clfnico breve (Lezak, 1995; 
Reitan, 1984, 1985). No obstante, sc evaluan 
ciertos elementos en comtin: 

• Hablu espontanea: el examinador busca sfn- 

tomas distintivos de afasia como dificultad 
para encontrar palabras o neologismos (p. ej., 
referirse a un peine como "planquer"). 

• Repeticion de oraciones y frases: el exami¬ 
nador Ic pidc al paciente que repita cslfmu- 
los como "por donde pecas, pagas" y 
"Metodista Episcopal”. Las tareas dc repeti- 
cibn son tan sencillas que las personas nor- 
malcs casi nunca las fallan. 

• Comprcnsion del lenguaje escrito: el exa¬ 
minador hace preguntas (“^Un autombvil 
tiene manijas?”) y da brdenes (’Tome este 
papel, dbblelo a la mitad y colbquelo en el 
suelo"). De nuevo, las tareas son tan senci¬ 


llas que los individuos normalcs nunca las 
fallan. 

• Localizacibn de palabras: el examinador 
scfiala a objetos comuncs y fbcilmcntc 
rcconocibles y pregunta: "f.Qud es esto?" 
Reactivos tfpicos incluycn un reloj. pluma, 
lbpiz, antcojos, anillo y zapatos. El examina¬ 
dor Ic puede pedir al paciente que nombre 
numcros. letras o colorcs. 

• Lectura: el examinador le solicita al pacicn- 
ic que lea y explique un pbrrafo corto adc- 
cuado para el nivel previo de educacibn c in- 
teligencia. Le puede pedir al paciente que siga 
instrucciones por escrito (p. ej., "Cierrc los 
ojos” o "Aplauda tres vcces con las manos"). 

• Escritura y copiado: el examinador le pide 
al paciente que escriba de manera espontb- 
nea o a partir de un dictado. Tambien, le puede 
pedir al paciente que copie material escrito y 
formas geomdtricas. El examinador estb in- 
teresado en producciones escritas con gra- 
mbtica sumamente errbnea y distorsiones 
importantes en el copiado.- 

• Ciilculo: cl examinador le pide al paciente 
que llevc a cabo cdlculos malembticos senci- 
llos (p. ej., 17x3) con y sin ayuda de papel 
para apuntes. Las tareas son tan simples que 
las personas normales pocas veces fallan. 

Con base en la evaluacibn clfnica, el examina¬ 
dor puede llenar una escala de calificacibn para 
la gravedad de la afasia. Por ejemplo, la eseala 
de calificacibn que se utiliza en el Boston 
Diagnostic Aphasia Exam (Examen Boston de 
Diagnbstico de Afasia; Goodglass y Kaplan, 
1983) incluye las siguientes caracterfsticas del 
habla: Ifnea melbdica, extensibn de la frase, agili- 
dad de la articulacibn, forma gramatical, loca¬ 
lizacibn de palabras y comprensibn auditiva. 

PRUEBAS DE DETECCibN 
Y DE DIAGNdSTICO COMPLETE) 

DE LA AFASIA 

Las pruebas cstandarizadas dc deteccibn de la 
afasia se asemejan de manera estrecha al exa¬ 
men clfnico breve. La diferencia csencial es que 
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las prucbas cstandarizadas dc deteccidn incor- 
poran instrucciones objetivas y prccisas para 
aplicacidn y calificacion. La dcbilidad de las 
pruebas dc cleteccidn cs quc no detectar^n 
|as formas sullies de la afasia. En la figura 9-8 
sc prcsenian los estfmulos para una prucba am- 
pliamcnte utilizada para la deteccidn de la 
afasia. 

Las prucbas para el diagndstico complete) 
dc la afasia son bastante extensas y se utilizan 
principalmente cuando se sabe que un paciente 
liene afasia. Estas pruebas proporcionan un 
perfil de habilidades del lenguaje quc es util 
para la planificacidn del tratamienlo. En el cua- 
dro 9-10 se presenta una description breve de 
varias pruebas dc afasia. 




PRUEBAS DE CAPACIDAD 
ESPACIAL Y DE MANIPULACl6N 



Las pruebas dc capacidad cspacial y de mani¬ 
pulation lambien se conocen como pruebas de 
desemperto constructivo. Una prueba de este 
lipo combina la actividad perceptual con la res- 
puesta motora y siempre ticne un componentc 
espacial (Lezak, 1995). Debido a que la capaci¬ 
dad constructiva implica varias funciones com- 
plejas, incluso las formas levcs dc disfunciOn 
cerebral tendrdn por resultado un deterioro en 
el desempeno constructivo. No obstante, se re- 
quicrc de observacidn cuidadosa para distinguir 
las causas del desempeno errdneo, que pueden 
incluir confusion espacial, dcftciencia percep¬ 
tual, dificultades de atencidn. problemas de 
motivacidn y apraxias. El tdrmino apraxia se 
refterc a una variedad de disfunciones caractc- 
nzadas por una desintegracidn en la direccidn 
oejecucidn de actos motores complejos (Strub 
y Black, 1985). Por ejemplo, un paciente que 
no puede demostrar edmo se utiliza una Have 
rccibirfa un diagndsticode apraxia idcomotora. 

Las pruebas del desempeno constructivo 
cngloban dos clases amplias de actividades: di- 
bujo y ensamblado. Debido a las limitaciones 
de espacto, sc revisardn sdlo unos cuantos ins- 
trumentos dcstacados dentro de cada categorfa. 
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Figura 9-8. Figuras estimulo de la Reilan-lndiana 
Aphasia Screening Test (Prueba Reltan-lndiana de De- 
teocttn de la Afasia). 

Fuente: Rolmpreso con autorlzacldn de Reltan, R. M. y 
Wolfsoo, D. (1993). The Halstead-Rettan Neuropsycho¬ 
logical Test Battery: Theory and Clinical Interpretation 
{2* EdiciOn). Tucson. AZ: Neuropsychology Press. The 
Reltan-lndiana Aphasia Screening Test esti disponlble 
en Redan Neuropsychology Laboratories, 2920 S. Fourth 
Ave., South Tucson, AZ 85713. 
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(Capflulo 9) 


Cuadro 9-10. Descrlpcldn breve 
de varias pruebas de la afasia 


Multilingual Aphasia Examination (Examen 
Multilingue de la Afasia) 

Benton, Hamsher, Rey y Sivan (1994) 

Esta baterfa respetada y amplia consiste de 11 
subpruebas y escalas de calificacibn que evaluan 
nombramienlo visual, repelicion, fluidez, articula- 
cion, ortograffa y otras variables del lenguaje; 
tambien disponible en espariol. 

Western Aphasia Battery (Baterfa Occidental 
de Afasia) 

Kertesz (1979) 

Prueba amplia de la lluidez verbal, comprensibn 
auditiva y repeticibn que prelende idenlificar 
sfndromes de afasia y determinar su gravedad. 

Boston Diagnostic Aphasia Examination 
(Examen Boston de Dlagnbstico de Afasia) 
Goodglass y Kaplan (1983) 

Prueba amplia con 46 subescalas que incluyen 
habilidades musicales, espaciales, de cblculo y 
siete tipos de habilidades en escritura, adembs 
de medidas tradicionales de la afasia; disponible 
tambibn en francbs e hindi. 

Aphasia Screening Test (Prueba de Deteccibn 
de la Afasia) 

Reltan (1984,1985) 

Uliliza el enfoque de signo palognombnico (error = 
sintoma de afasia) y no produce un rango de pun- 
tuaciones. Es una buena prueba de deteccibn pero 
es posible que no delecte deterioros sutiles. 

Aphasia Language Performance Scales, ALPS 
(Escalas de Afasia de Desemperio en el Len¬ 
guaje) 

Keenan y Brassell (1975) 

Se someten a prueba las cuatro principales 
modalidades del lenguaje (habla, audicibn, leclura. 
escritura) con 10 reactivos de complejidad creden- 
te. Tiene buena confiabilidad (rangos de .80 y .90) 
y correlaciones robuslas (.94) con el PICA, lislado 
adelante. 

Porch Index of Communicative Ability, PICA 
((ndice Porch de Habilldad de Comunicacion), 
Porch (1967) 

Una bateria que contiene 18 subpruebas con 10 
reactivos, cuatro verbales, ocho por ademanes y 
sets grbficas. Es una prueba muy confiable que se 
utiliza con frecuencia para medir pequerios cam- 
bios en el desempeno del paciente. 


Cuadro 9-10. Descripcidn breve 
de varias pruebas de la afasia 
(continuacion) 


Token Test (Prueba de Fichas) 

Spreen y Strauss (1998) 

Una prueba sumamente sensible que represen¬ 
ts un desafio menor para los individuos normales. 
La persona evaluada debe llevar a cabo brdenes 
orates con fichas de colores; por ejemplo, “Coloquo 
la ficha roja pequeria sobre la ficha cuadrada gran¬ 
de." Diseriada originaimente por Boiler y Vignolo 
(1966), en la aduafidad se encuenlran dispodbles 
numerosas versiones de la Prueba de Fichas. 


PRUEBAS DE DIBUJO 

Mbs alia dc cualquier duda, la prueba de dibujo 
de mbs amplia utilizacibn cs el Test Guestbltico 
Visomotor, conocido de mancra mbs comun 
como Prueba Gestalt dc Bender (BGT, Bender. 
1938). La BGT consta de nuevc figuras cstf- 
mulo (figura 9-9); sc instruye a la persona eva¬ 
luada para que copie cada figura en una hoja 
dc papel en bianco. Se dice al examinando que 
la BGT: "... no cs una prueba de capacidad ar- 
tfstica, pero interne copiarel dibujo lo mbs pre- 
cisamentc posible. Trabaje con la rapidez o 
lentitud que usted desec” (Huu, 1977). 

Sc han diseriado varios sistemas de califi- 
cacibn para determinar si el desemperio de una 
persona es el mbs comun en individuos con dnrio 
cerebral o sin bl (Main, 1964; Hutt y Briskin, 
1960; Lacks, 1999; Pascal y Suttell. 1951; 
Pauker, 1976). En cl caso dc adultos, cl mejor 
de estos enfoques dc calificacibn se cneucntra 
en Lacks (1999). Esta autora identified 12 sig- 
nos cualitativos que se califican segdn presen- 
cia contra ausencia en el protocolo completo. 
La presencia de cualesquiera de los cinco sig- 
nos indica dario cerebral (cuadro 9-11). Con 
base en la confirmacibn independientc de otras 
fuentes de informacibn, Lacks resefia tasas de 
bxito de 82 a 86% en una mucstra combinada 
dc admisiones a la unidad de tratamiento psi- 
quibtrico agudo de un centro urbano de saiud 
mental comunilaria (Lacks y Newport, 1980). 
En Gregory (1999) se analizan diversas varia- 
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Figura 9-9. Esllmulos para el Test GueslAltico Visomotor. 

Fuente: Reproducido con aulorlzacldn de Bender, L. (1938). A visual motor gestalt lest and lls clinical use. Nuevo 
York; American Orthopsychiatric Association. Copyright © American Orthopsychiatric Association. 


ciones intcresantes cn la BGT. Groth-Mamat 
(1990) dedica un capftulo completo a este ins- 
trumento, incluyendo pautas interpretativas para 
ninos y adultos. 

La Cruz Gricga (Rcitan y Wolfson, 1993) 
es una tarea muy sencilla de dibujo sorprcn- 


dentemente sensible al deterioro cerebral. Se le 
solicita de manera cuidadosa a la persona eva- 
luada que copie la figura sin levantar cl 16piz, cs 
dccir, trazando el perimctro. En la figura 9-10 
sc mucstran la figura cstfmulo y ejemplos de 
desempeno defectuoso. Es mas frecuente que 
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(Capitulg 9) 


Cuadro 9-11. Resumen de signos 
diagnosticos en el Test Guestaltico 
Visomotor 


1. Rotation: la figura se rota de 80 a 180 grados. 

2. Dificultad do superposition: problema para dl- 
bujar las paries de una sola figura que debe- 
rfan traslaparse. 

3. Simplification: se simplifica la figura. 

4. Fragmentation: la figura se descompone de 
lal manera que se pierde la gestalt general. 

5. RetrogresiOn: sustitucibn con una forma gestalt 
mas primitiva que el estimulo. 

6. PersovoratiOn: los aspectos de un estimulo 
anterior se llevan al estimulo actual. 

7. ColisiOn: dos figuras independientes se super- 
ponen o chocan entre si. 

8. Impolentia: numerosas borraduras e incapa- 
cidad para terminar un dibujo a satisfaction 
de la propia persona. 

9. Dilicultad de cierre: dificultad para lograr que 
se toquen las partes adyacentes de una figura. 

10. Falta de coordination motora: el temblor es 
evidente en el dibujo. 

11. Dilicultad de angulation: dificultad grave en la 
reproduction de los Angulos de los dibujos. 

12. Cohesion: disminucibn o incremento aislados 
en tamano de una subparte de un dibujo. 


Nota: So puede conlar un decimolercer error sj la prueba 
complete requiere mis de 15 minulos 
Fuonlo: Basado en Lacks, P (1999) Bernier Gestalt screening 
lor brain dyslunclion (2* edicidn) Nuova York: John Wiley 

esta prueba se valore con una base cualitativa, 
aunqueexjsten pauias dc culificacibn (Swicrcinsky. 
1978; Gregory, 1999). 

PRUEBAS DE ENSAMBLADO 

En su libro clbsico sobre los lbbulos parietales, 
Critchley (1953) proporcionb la fundamcntacibn 
para incluir [areas de construccibn tridimensio¬ 
nal en una bateria de pruebas neuropsicolbgicas: 

Es posiWe, y de hecho es util, proceder a pro- 
blemas en espacio tridimensional, aunque las 
pruebas de este tipo s6lo se emplean en ra- 
ras ocasiones. Esta es una (area mbs dificil y 
los paclentes que responden moderadamente 
bien a los procedlmientos comunes con varilas y 


Ibpiz y papel, pueden presenter anormalidades 
notables cuando se les pide que ensamblen cu- 
bos segun un palron tridimensional. 

Benton, Sivan, Hamsher, Varney y Sprcen 
(1994) prcsentan una prueba tridimensional dc 
construccibn con cubos que tiene excelentes 
normas y pautas dc calificacibn. Las dos for- 
mas de la prueba (Formas A y B) constan de 
tres modclos con cubos que se presentan al 
pacicntc uno a la vez. A la persona se le pide 
que construya una rbplica cxacta del modclo 
seleccionando los cubos apropiados entre un 
conjunto de cubos sueltos en una bandeja. Con 
base en las omisiones, adiciones, sustituciones 
y desplazamientos, los tres modclos se califi- 
can de 0 a 6, 8 y 15 puntos, respcctivamcnte, 
Esta prueba es bastante sensible al deterioro 
cerebral, en especial cuando estil afectada el 
drea parietal izquierda o derccha. Lczak (1995) 
examina otras (areas de ensamblado. Se debe 
mencionar que la Tactual Performance Test 
(Prueba de dcsempebo tdctil) de la baterfa 
Halstead-Reitan es, en parte, una (area de en¬ 
samblado que mide las capacidades espaciales 
y de manipulacibn (cuadro 9-7). 

j EVALUACION DE LAS FUNCIONES 
> EJECLOTVAS 


Las funciones ejeculivas incluyen analisis Ibgi- 
co, conceptuactbn, razonamiento, planificacibn 
y flcxibilidad de pensamiento. La evaluacibn 
de las funciones ejecutivas presenta un dilema 
poco comun para las ncuropsicblogos: 

Uno de los principales obstbculos para examinar 
las funciones ejecutivas es la paradbjica necest- 
dad de estructurar una situation en la que los 
paclentes puedan mostrar si pueden y que tan 
bien pueden conformar una estructura por sf mls- 
mos. Es comun que en los eximenes tormales 
el examinador determine cubl actividad debe rea- 
lizar el individuo y con qu6 materiales, cuando, 
dbnde y cbmo. Por ejemplo. la mayor parte de 
las pruebas cognitivas le dan poca oportunidad 
a la persona de presentar conducts discrectonal, 
Induyendo muchas pruebas que se consideran 
sensibles a los trastomos ejecutivos —o del lb- 
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Flgura 9-10. Flgura estfmuto de la Cruz Griega y reproducciones de personas con dafto cerebral conocldo. 

a) Figure estfmulo. 

b) Trabajador secretarial con disfuncibn dilusa del hemlsferlo derecho de origen desconocido. 

c) Profesor universitario dos anos despubs de una embolla en el hemlsferlo derecho. 

d) Paclenle con demencla dilusa, generalizada. 

Fuente: Reproducldo con autorizacion de Gregory, R. J. (1999). Foundations ot intellectual assessment: The WAIS-tll 
and other tests In clinical practice. Boston: Allyn & Bacon. 


bulo frontal... El problems para los clinicos quo 
dosoan oxamlnar las funclones ejecutlvas liene 
que ver con el c6mo translerir el establocimiento 
de metas. la estructuracidn y la toma de decisto- 
nes del clinico al individuo dentro de un examen 
estructurado (Lezak, 1995). 

Muchos neuropsicologos rcsuclvcn estc dilc- 
ma al utilizar el mdtodo clfnico para evaluar las 
funciones ejecutivas en lugar de aplicar prue- 
bas formales (Cripe, 1996). Por ejcmplo. 
Pollens, McBratnicy Burton (1988) utilizanuna 
entrevista y observaciones para Ilenar la lista es- 
tructurada de verificacidn sobre funciones 
ejecutivas que se menciona en cl tcma anterior. 

Sdlo un numero limitado de prucbas 
neuropsicoldgicas delectan las funciones ejecuti¬ 
vas en grado razonable. Instrumentos utiles en 
cste sentido incluyen el Test de Laberintos Poileus, 
la Wisconsin CnnlSorting Test (Prueba Wisconsin 
de Clasificacidn de Tarjctas) y un enfoque no- 


vedoso conocido como Ttnkerioy® Test (Prue¬ 
ba Tinkcrtoy®). Se Ic rccucrda al lector que la 
Prueba de categorfas de la baterfa Halstcad- 
Rcitan tambien capta las funciones ejecutivas 
hasta cierto nivel (cuadro 9-7). 

El Test de Laberintos Porteus se diseild 
como una medida con reduccidn cultural de la 
planificacidn y previsidn (Porteus, 1965). Sin 
levantar el I4piz e intentando evitar los pasadi- 
zos sin salida, la persona evaluada debe trazar 
una Ifnea a travds de una serie de laberintos de 
dificultad cada vez mayor. Este instrumento 
que se utiliza muy poco es bastante sensible 
a los cfcctos del dano cerebral, en particular en 
los Idbulos frontales (Smith y Kinder. 1959; 
Smith, I960; Tow. 1955). 

La Wisconsin Card Sorting Test (Prueba 
Wisconsin de clasificacidn de tarjetas) cs una 
buena medida de las funciones ejecutivas, aun- 
que se debate su sensibilidad diferencial al dano 
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en el 16bulo frontal (Mountain y Snow, 1993). 
El inslrumento se discnd para estudiar el pen- 
samiento abstracto y la capacidad para cambiar 
de propcnsidn (Berg, 1948; Heaton, Chclune, 
Talley y colaboradorcs, 1993). A la persona 
cvaluada se Ic proporciona un paquctc con 64 
larjetas en las que estan impresos uno de cua- 
tro sfmbolos (tritingulo, estrclla, cruz y cfrculo) 
en uno de cuatro colorcs (rojo. verde, amarillo 
o azul). No hay dos tarjetas identicas. Asf, cada 
una incluye un numcro, una forma particular 
y un color cspccffico. La persona debe clasifi- 
carlas debajo de cuatro tarjetas estfmulo segun 
un principio desconocido (figura 9-11). Por 
cjemplo, el principio desconocido podrfa ser 
‘'clasifiquc segun el color”. A medida que la 
persona evaluada coloca las tarjetas, el exami- 
nador puede decir “corrcclo” o “incorrecto". 
Dcspues de que el individuo ha clasificado una 
sccucncia de 10 asignaciones correctas en una fi- 
la, el examinndor cambia cl principio sin ad- 
vertencia. La prueba continua hasta que la 
persona ha hecho seis sccuencias de 10 asigna¬ 
ciones correctas. La prueba puede calificarse 
de diferentes mancras, incluycndo el numcro 
total de ensayos para llegar al criterio (Axelrod, 
Grcve y Goldman, 1994). 


Lezak (1982) ha disefiado la TmkertoyQ 
Test (Prueba Tinkertoy®) para dar a los pacien- 
tes la oportunidad de demostrar sus capacida- 
des cjccutivas dentro del forma to estructuradodc 
un examcn. Se colocan 50 piezas de un con- 
junto 77nAerfoy®est4ndar sobre una superficie 
limpia y se le dice a la persona evaluada: “Cons- 
truya lo que quiera con estas piezas. Tendrf 
como mfnimo cinco minutos y como mdximo 
el tiempo que desee para hacer algo". La pnre- 
ba sc califica desde -1 hasta +12 con base cn 
diversas variables que incluycn cl numcro de 
piezas utilizadas, la movilidad de la conslruc- 
ci6n, simetrfa y asignacidn de nombre para 
la construccidn. Los pacientes con lesidn cef.lli- 
ca produccn disehos deficientes que constan 
de un pequeflo numcro de piezas. Es frecucntc 
que estos individuos sean incapaccs dc propor- 
cionar un nombre para sus construcciones. 

Bay less, Varney y Roberts (1989) estu- 
diaron la validez predictiva de la Prueba 
Tinkertoy® al comparar los rcsultudos de 50 
pacientes con lesioncs cefalicas cerradas contra 
25 controles normales. La mitad de las indivi¬ 
duos con cste tipo dc lesiones habfa regresado a 
su trabajo y la mitad no lo habfa hecho. Mien- 
tras que todos, menos uno, dc los pacientes 



Figura 9-11. Tarjetas y pilas de daslftcackin para la Wisconsin Card Sorting Test (Prueba Wisconsin de clasilicacidn 
de tarjelas). 

Fucntc: Reproducido con autorizaddn especial do Psychological Assessment Resources, Inc. Derechos reservados. 
Copyright © 1981 de Psychological Assessment Resources, Inc. 
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con lesidn cefdlica quc habfan regresado al tra- 
fiajo obtuvieron puntuaciones normalcs en la 
pjxicba Tinkcrtoy®, casi la mitad de aqucllos 
que no habfan regresado a su Irabajo luvieron 
un desempeno por debajo del ni vel del peor par¬ 
ticipate control. Los investigadorcs concluye- 
ron que: 

La prueba paroco particularrnente adecuada para 
demostrar la presencia de defidencias en el lun- 
donamionlo ejecutlvo, Ins cuales han resultado 
dilfeiles de demostrar con pruebas cllnicas, a 
pesar de que Uenen secuelas catasirottcas en 
(os esfuerzos colktlanos vocacionales o pslcoso- 
dales (Bayless y cols., 19B9). 

Los neuropsicdlogos continuan nccesitando 
medidas adicionales dc las funcioncs cjecuti vas. 
Un enfoque prometedor en las primeras ctapas 
de desarrollo es la cvaluacidn realista del ha- 
llazgo de rutas. La capacidad para cncontrar un 
lugar desconocido en una ciudad requiere de 
estrategia, automonitoreo y maniobras correc- 
tivas. £stasson funciones ejecuti vas que se apli- 
can a un problema real (Boyd y Sauter, 1993). 
Otro enfoque prometedor sc encucntra en una 
reciente baterfa denominada Behavioral 
Assessment of Dysexecutive System (BADS) 
(Bvaluacidn conductual del sistema disejecutivo; 
Wilson, Alderman, Burgess y cols., 1996). La 
baterfa BADS consta de scis nuevas pruebas 
que son similarcs a las actividades dc la vida 
teal: 

1. Cambio dc reglas en juegos dc naipcs 

2. Solucion de problemas con un vaso de preci- 
pitados lleno de agua 

3. Busqueda simulada de una Have perdida 

4. Juicio del tiempo neccsario para actividades, 
acontecimientos 

5. Hallazgo dc ruta con un mapa 

6. Tarca de organizacidn que implica dictado, 
aritm&ica, asignacidn de nombre 

La baterfa tambi£n incluye un cuestionario de 
20rcactivosquesecalificaen unaescala Likert 
decinco puntos (0 a 4). Los reachvos incluyen 
cambios probables cuando cxiste dctcrioro en 
las funcioncs ejecutivas, por ejemplo, ‘Tengo 


dificultad para pensar de antemano y planear 
para el futuro”. Sprecn y Strauss (1998) pro- 
porcionan una util resena sobre esta promctc- 
dora baterfa dc pruebas. 


: EVALUACION DE LA SALIDA 
§8! MOTORA 


La mayor parte dc las balerfas de pruebas 
neuropsicoldgicas incluyen medidas de veloci- 
dad y precision en la manipulacidn. Lezak 
(1995) proporciona una rcsefia amplia. Aquf sc 
resumirtin brevemente tres enfoques: golpeteo 
con los dedos, dcsempefio en un tablcro de cla- 
vijas y trazado dc Ifneas. 

Quiza la prueba de uso m£s amplio de la 
destreza motora es la Finger-Tapping Test 
(Prueba dc Golpeteo con los Dedos) dc la bate¬ 
rfa Halstead-Rcitan. fist a consta de una tccla 
para oprimir que sale de un instrumento mec6- 
nico dc conteo incorporado dentro dc un table- 
ro piano. Con cl dedo fndice dc cada mano, la 
persona evaluada llcva a cabo una serie de cn- 
sayos dc 10 segundos hasta quc cinco seguidos 
sc cncucntran dentro de un rango de cinco pun¬ 
tos. La puntuacidn para cada mano es cl pro- 
medio dc cstos cinco ensayos, redondeada al 
numero enlero m£s cercano. Con la mano do- 
minante, los varones por lo comun alcanzan 
puntuaciones dc 54 golpes (DE de 4), mientras 
las mujeres suelen lener puntuaciones de cerca 
de 51 golpes (DEde 5, Dodrill, 1979; Morrison, 
Gregory y Paul, 1979). 

En general, el nivel absoluto de desempefio 
es de menor interns quc las capacidades relati- 
vas en ambos lados del cucrpo. La cxpectativa 
normativa es que la mano no dominantc ten¬ 
dril una tasa de golpeteo dc aproximadamente 
90% con relacidn a la dominante. Se considera 
que las desviaciones significativas con respec- 
to a este patron indican una lesidn en el hemis- 
ferio opuesto a la mano m<is lenta (Haaland y 
Delaney, 1981). No obstante, dichas inferences 
deben rcalizarsc con gran cuidado, debido a la 
baja confiabilidad dc la punluacidn de propor- 
ci6n. Aunque las confiabilidades test-retest e 
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interexaminadores para cada mano sc acercan 
a .80. la confiabilidad dc la puntuacidn de pro- 
porcidn es un pdsimo .44 a .54 (Morrison, 
Gregory y Paul, 1979). La puntuacidn de pro- 
porcidn debe ulilizarse con extremo cuidado 
cuando se haccn infercncias clinicas sobre la 
lateralizacidn del dano. 

El Test no verbal de la Universidad dc 
Purdue requiere quc la persona cvaluada colo- 
que clavijas dcntro de orificios con la mano 
izquierda, dcrecha y despuds con ambas ma- 
nos. Cada ensayo dura s6lo 30 scgundos, de 
modo que la prueba complcta puede aplicarse 
en cuestidn de minutos. Tiffin (1968) informa 
de puntuaciones normaiivas para solieitantes de 
empleo. La Icniitud relativa en una mano su- 
gierc una lesidn en el hemisferio opuesto. micn- 
(ras la lenlitud bilateral indica dano cerebral 
difusoo bilateral. A1 utilizar el Test no verbal dc 
la Universidad dc Purdue de mancra aislada, 
un estudio cncontrd 80% de precisidn en la 
idcntificacidn de deterioro cerebral cn un gran 
grupo de individuos normales y pacientes 
ncuroldgicos (Lezak. 1983). Otros estudios in- 
forman datos menos favorables (Heaton, Smith, 
Lehman y Vogt. 1978). El Test no verbal dc 
la Universidad dc Purdue es una adicidn util a la 
batcria completa, pero no debe utilizarse por sf 
solo para propdsitos de deleccidn. Spreen y 
Strauss (1998) proporcionan un excclentc rc- 
sumen de las normas de csla prueba aniplia- 
mente utilizada. 

Klovc ha dcsarrollado una variacidn de la 
prueba dc tablero dc clavijas en la que dslas 
tienen un borde en uno dc los lados (Klove, 
1963). Debido a que cada clavija tiene que gi- 
rarse a una posicidn, cl tablero perforado para 
clavijas requiere de coordinaci6n compleja, 
adcm.is de destreza motora. La Grooved 
Pegboard Test (Tablero Perforado para Clavi¬ 
jas) es un cxcelente instrumento para evaluar el 
dano cerebral lateralizado (Haaland y Delaney. 
1981). 

Por ultimo, debe mcncionarse que las prue- 
bas motoras utiles no requieren dc cquipo com- 
plejo. Lezak (1995) rccomicnda una Line 
Tracing Task (Tarea de Trazado de Li'neas) para 
evaluar las dificultades en la regulacidn moto¬ 


ra (figura 9-12). Se proporciona al cxaminan- 
do una pluma dc colores brillantes con tjunta 
de fieltro y una hoja de papel con varias figuras 
y se le pide que dibuje sobre las Ifneas con la 
mayor rapidcz posible. Las dificultades con 
la rcgulacidn motora sc observan en el dcsbor- 
dainiento cn las csquinas, perseveracidn en una 
respuesta continua e incapacidad para seguirlas 
curvas reducidas en la ultima figura. Debido a 
quc csta (area la llcvan a cabo con facilidad 
la mayorfa dc los nihos de 10 afios, cualcsquie- 
ra desviaciones notables sugiercn dificultades 
cn regulacidn motora. 

BATERIAS DE PRUEBA 
& EN EVALUACI6N 
m NEUROPSICOLOGICA 


Ahora que se ha complctado un recorrido sobre 
algunas pruebas y procedimientos neuropsico- 
Idgicos individuales, es tiempo otra vez dc re- 
cordar al lector que muchos ncuropsicdlogos 
prefieren utilizar una baterfa fija cn vez de un 
surtido sicmprc cambiantc e individualizadode 
instrumcntos. Con toda seguridad una de las 
baterfas fijas de m£s amplia utilizacidn es el 
Luria-Nebraska Neuropsychological Battery, 
LNNB (Diagndstico Neuropsicoldgico Luria- 
Ncbraska; Golden, 1989; Golden. Purish y 
Hammeke, 1980, 1986). 



Figura 9-12. Tarea tipica de trazado de lirveas (lamaiV) 
reducido). 

1 
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La prueba consta de 269 reactivos separa¬ 
tes, elegidos del trabajo de Luria (p. ej., 1966) 
y estandarizados dc mancra formal. Eslos 
reactivos se califican con 0, I o 2, segtin los 
criterios precisos del manual de aplicaci6n 
y calificacidn. Los reactivos similares se en- 
cuentran agrupados cn 11 esealas clfnicas, de 
|a Cl a la Cl 1 (cuadro 9-12). Las puntuaciones 
jiaturales en cada escala se convierten a pun- 
tuacioncs T, con media dc 50 y desviacion cstin- 
dai dc 10. Las puntuaciones mis alias reflejan 
mayor psicopatologfa; aquellas superiorcs a 70 
son especialmente sugcrentes de daiio cerebral. 

Cuadro 9-12. Pruebas y procedimlentos 
de la Luria-Nebraska 
Neuropsychological Battery 


Escala de capacidad: Tareas incluidas 

Cl Motora: coordinacibn, velocidad, dibujo, capa- 
cldades motoras complejas. 

C2 Rftmica: atender a, discriminar y producir estf- 
mulos rftmicos verbales y no verbales. 

C3 Tictil: identificar estfmulos tictiles, incluyendo 
esKmulos trazados sobre las munecas. 

C4 Visual: identificar dibujos, incluyendo objetos 
superpueslos o fuera de loco; resolver matrices 
progresivas y otras habilidades visoespaciales. 
C5 Discurso receptivo: discriminar fonemas y com- 
prender palabras, frases, oraciones. 

C6 Discurso expresivo: articular sonidos, palabras 
y oraciones de manera lluida; identificar objelos 
representados en imagenes o descritos. 

C7 Escritura: utilizar capacidades motoras de escri- 
tura en general; copiar y escribir a partir de dictado. 

C8 Lectura: leer lelras, palabras y oraciones; sinte- 
tizar las letras en sonidos y palabras. 

C9 Anlmetica: llevar a cabo calculos matemilicos 
sencillos; comprender los signos matematicos y 
estruclura de los numeros. 

CIO Memoria: recordar estimulos verbales y no 
verbales bajo condiciones tanto de interferencia 
como sin ella. 

Cl 1 Intellgencia: razonamiento, lormacion de con- 
ceptos y solucibn de problemas matemilicos 
complejos. 


Tambidn se obticncn Ires esealas de resu- 
men a partir del dcsempeno en prueba; SI 
(Patognom6nica), S2 (Hemisferio izquierdo) y 
S3 (Hemisferio derccho). La primera escala 
rcflcja el grado de compensacidn que ha ocu- 
rrido desde la lesion, como la reorganizacibn 
funcional del cerebro, asf como la recupera- 
cion fisica cn sf. Las puntuaciones mis altas 
reflejan mcnor compensation. Las esealas dc 
Hemisferio izquierdo y Hemisferio derecho 
pueden ulilizarsc para ayudar a determinar si 
una lesion es difusa o lateralizada. Tanibien 
cstin disponibles varias otras esealas y facto- 
res interprelativos (Golden, Purish y Hammeke, 
1986). El empleo del LNNB sc iluslra en el 
ejemplo de caso 9-2. 

En estc libro no es posible revisar la volu- 
minosa literature accrca del LNNB, no obstan¬ 
te con seguridad es ncccsario mencionar de 
modo breve unos cuantos estudios clave. La 
confiabilidad del LNNB sc ha valorado a partir 
de las perspectivas comuncs (por mitadcs, con- 
sistencia interna y test-retest), con resultados 
cxcclcntcs. Por ejemplo, la confiabilidad me¬ 
dia test-retest para las esealas clfnicas es dc 
cerca de .90 (Bach, Harowski, Kirby, Peterson 
ySchulein, 1981; Plaislcd y Golden. 1982). En 
diversos estudios de validez accrca dc la clasi- 
ficacibn de personas con daiio cerebral contra 
otros grupos de critcrio, cl LNNB ha mostrado 
tasas de dxito de 80% o mejores (Golden, 
Moses, Graber y Berg, 1981; Hammeke, 
Golden y Purish. 1978; Moses y Golden, 1979). 

A pesar de las conclusiones positivas que 
informaron Golden y sus colaboradores, muchos 
ncuropsicblogos continuan mostrendo cscepti- 
cismo accrca del LNNB (Lezak, 1995; Kolb y 
Whishaw, 1990; Crosson y Warren, 1982; Delis 
y Kaplan, 1982, 1983). Por ejemplo. Delis y 
Kaplan (1983) afirmaron que la heterogencidad 
de las esealas es tan grande que las puntuaciones 
no cuantifican dcficicncias neuropsicologicas 
especiTicas: 

En la *validacion" de la baterfa, la elevactOn en 
una escala se analizd solo en termlnos de la di- 
lerenciacton de un grupo de pacientes "con dafio 
cerebral* con respecto a personas "normales". 
Nunca se tomb slqulera en consideracidn la 
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EjEMPLO DE CASO 9-2 

DIAGN6ST1CO NEUROPSICOL6GICO LUR1A-NEBRASKA (LNNB) 


Para ilustrar la aplicaddn del LNNB. se presenta el caso de un vardn de 56 anos de edad, con 
educacldn de posgrado (Golden, 1989). Esle pacienle experimenld dos embolias en el hemlsferio 
derecho antes de la aplicacidn del LNNB. Sus punluacionos en las escalas cllnlcas y de resumen 
se muestran abajo. El lector observers la marcada elevacidn de S3 (Hemisferlo derecho, 
T= 124), en comparacidn con S2 (Hemlsferio izqulerdo, T= 81), lo cual senala una lesidn 
que estd fuerlemenle laleralizada hacia el lado derecho del cerebro. Tambidn vdase qua Si 
presenta una elevacidn solamenle moderada (T = 75), lo cual indica que el pacienle ha logrado 
un progreso adecuado para compensar su deterioro cerebral. El lenguajo (C5 y C6) e inteligencia 
(Cl 1) esldn Intactos en Idrminos generales, pero lectura, escritura y memorla (C7. C8 y CIO) 
mueslran un postble delerioro sulil (T = 60, 60 y 65, respedivamonte). Las discapacidades mds 
graves se presenlan en Cl a C4, es declr, Molora, Ritmica, Tdctil y Visual. Esto indica grave 
deterioro sensoriomotor. El examen de los errores especlflcos en las escalas reveld que la visidn 
participd en 74% de los errores. El paciente mostrd un descuido unilateral izquierdo consisten- 
te, en el que se ignord el lado Izqulerdo de los eslfmulos visuales (como en palabras u oracionos), 
En general, los resultados son bastante consistentes con un accidente cerebral vascular 
mayor en la arteria cerebral media del hemlsferio derecho. La embolia dafid aparentemonle las 
4reas sensoriomotoras y tambidn los haces neuronales subcorticales que lerminan en las dress 
visuales del cerebro. 


Escala 


Puntuacidn T 

Cl 

Motora 

99 

C2 

Ritmica 

92 

C3 

Tdclil 

92 

C4 

Visual 

85 

C5 

Receptiva 

39 

C6 

Expresiva 

40 

C7 

Escritura 

60 

C8 

Lectura 

60 

C9 

Arilmdtica 

45 

CIO 

Memoria 

65 

C11 

Inteligervcia 

53 

SI 

Palognomdnlca 

75 

S2 

Hemlsferio izquierdo 

81 

S3 

Hemisferio derecho 

124 


NoU: La* ponruactooes esporadas para personas normales son aproxlmadamenle de SO. puntuadones superlores reflejan 
mayor dolanofo 
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validez cfe conslructo acofca de si la Blevadon 
en una escala particular representaba un dano 
on esa capacldad. 

Los mismos autores demostraron que las csca- 
las relacionadas con el habla no se orientaron a 
sfndromcs dc afasia y, por tanto, es posible que 
dieran un diagnbstico incorrecto dc las dcfi- 
ciencias cn lenguaje (Delis y Kaplan. 1982). 
Lezak (1995) senala la brecha que scpara a las 
valoraciones del LNNB realizadas por Golden 
y colaboradorcs de aqubllas hechas por otros 
ncuropsicdlogos. Con base cn su lectura dc la 
literatura. Kolb y Whishaw (1990) concluycn 
que la “utilidad y validez dc esta baterfa cst£ 
lejos de habcrsc probado”. Snow (1992) y Van 
Gorp (1992) tambidn rccomicndan precau- 
ci6n, al senalar que cl LNNB es adecuado para 
identificar a individuos con dctcrioro cerebral 
cn general, pero es cuestionable en la idenlifi- 
caciun del tipo, localization y consecuencias 
del dano cerebral. Otro problema con el LNNB 
es la alta tasa de falsos positivos cn cl caso dc 
pacicntes geridtricos. Con personas normalcs 
dc 70 afios dc edad y mayores, las tasas de 
falsos positivos van de 21 a 41%, dependiendo 
del mbtodo dc intcrpretacidn que se utilice 
(Roecker, House y Graybill, 1992-93). 

I evaluao6n del estado 

MENTAL EN ANC1ANOS 

El examen de status mental (ESM) cs una en- 
trevista aproximadamente estructurada que por 
lo general precede a otras formas dc cvalua- 
cidn psicoldgica y mddica. El propdsito de 
dsta consiste cn proporcionar una dcscripcidn 
precisa del funcionamiento del pacicnte en las 
Ureas de orientacidn, memoria. pensamiento, 
seniimicnto y juicio. El ESM es el equivalente 
psicoldgico del examen ffsico general: de la 
misrna manera en que el m&lico revisa todos 
los principals sistemas organtcos en busca de 
evidencia de enfermedad, el psicdlogo revisa 
las principales categorias de funcionamiento 
personal c intelcctual en busqueda de signos y 
sfntomas de psicopatologfa (Gregory, 1999). 


Aunque existe cierta libertad en cuanto al es- 
pectro del ESM, siempre se investigan ciertas 
funcioncs mcntalcs. Una valoracidn tfpica toca 
las dreas listadas en el cuadro 9-13. 


Cuadro 9-13. Principales Areas 
de un examen tfpico del estado mental 

Apariencia y conducta 

Arreglo personal 
Expresiones (aciales 
Conducta molora gruesa 
Contacto visual 

Discurso y procesos de cornunicacibn 

Contenido, (recuortda, tono y volumen del discurso 

Dlficultad, conlusibn o empleo inadecuado de las 
palabras 

Contenido del pensamiento 

Lbgica, claridad, idoneidad 
Deiirios 

Funcionamiento cognitivo y de la memoria 

Capacidad de calculo 

Recuerdo inmediato 

Memoria reciente y remota 

Reserva de inlormacion 

Capacidad de abstraccidn 

Funcionamiento emocional 
Estado de Animo predominante 
Idoneidad del afecto 

Insight y juicio 
Consciencia de los problemas 

Orientacidn 

Dfa, iecha, bora, lugar. 

Fuenti: Basado en Gregory, R J. (1999) Foundations ot 
intellectual assessment: The WAIS-III and other test in clinical 
practice. Boston, MA AJIyn y Bacon. 
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Algunos de los clementos de esta lista puc- 
den evaluarse con pruebas cortas de detection. 
En particular, la cogniciOn, mcmoria y onentaciOn 
son funcioncs intclectualcs que pueden exami- 
narse de inanera formal, estructurada (Hodges, 
1994). En esta scccidn se revisardn vanas me- 
didas breves del estado mental que emplean los 
clfnicos para complcmcntar sus impresioncs de 
entrevista. Estas medidas se emplean mOs en la 
valoraciOn del estado mental de las ancianos, en 
especial cuando el clicntc parcce tener un tipo 
de demencia eomo la enfermedad de Alzheimer. 
Las pruebas formales del estado mental son utiles 
tambiOn en la evaluaciOn de ciertos padecimien- 
tos con deterioro cerebral como lesiones cefOli- 
cas, esquizofrenia, depresibn grave y dclirio 
inducido por drogas. Es importantc enfatizar 
que las pruebas de detcccidn son complcmen- 
tarias —no recmplazan al juicio clfnico en la 
valoraciOn del estado mental. Algunas de las 
drcas que se cubren con el ESM son simplc- 
mente imposibles de cuantificar. Porcjcmplo, la 
valoraciOn del insight de un paciente requiere 
de observaciOn aguda y de habilidadcs sensi- 
blcs para la entrevista. No existc una prueba de 
detecciOn para cl ESM que mida el insight. 

EXAMEN DEL ESTADO MINIMENTAL 

La herramienta de uso mOs amplio para cl csta- 
do mental es el Mini-mental state examination , 
MMSE (Examen del Estado Minimental), una 
prueba de detection de 5 a 10 minutos que 
produce un fndice global del funcionamien- 
to cognitivo (Folstcin, Folstein y McHugh, 
1975; Tombaugh, McDowell. Kristjansson y 
Hubley, 1996). La prueba conliene 30 reactivos 
calificables que lienen que vercon oricntacidn, 
memoria inmediata, atcnciOn, cdlculo, produc- 
cibn y comprensiOn del lenguaje y copia de 
disenos. Los reactivos son tan fdcilcs que la 


mayorfa de los adultos normales casi siempre 
obtienen puntuacioncs en el rango de 27 a 30 
puntos (figura 9-13). 

La confiabilidad de este scncillo instrumen- 
to es excelente. Folstein y colaboradores (1975) 
informan de una confiabilidad test-retest a 24 
horas de .89 para 22 pacicntes con diversos sm- 
lomas de depresidn. La confiabilidad para un 
periodo de 28 dfas con 23 pacicntes clfnicamcn- 
tc estables con diagnOslicos de demencia, depre- 
sidn y esquizofrenia fuc un impresionante .99. 
Sc cncucntran disponibles datos normati vos que 
provienen de varias fuentes (p. ej.. Lindal y 
Stefansson, 1993; Tombaugh, McDowell, 
Kristjansson y Hubley, 1996). 

Con una puntuacidn de corte de 23 o me- 
nor como anormal y 24 o mayor como normal, 
el MMSE tiene cerca de 80 a 90% de preci¬ 
sion en la identification de pacientes ancianos 
de los que sc sospecha la presencia de enfer¬ 
medad de Alzheimer u otros tipos de demen¬ 
cia. Esta puntuaciOn de corte produce menos 
falsos positivos (pacientes normales a los que 
sc clasifica dentro del diagnOstico de de¬ 
mencia). La sensibilidad del instrumento depen- 
de de varios factores, incluycndo la puntua¬ 
cidn de corte utilizada, cl nivcl educativo de la 
persona evaluada, cl grado de la demencia, 
la naturaleza de la patologfa subyacentc y el 
tipo dc entomo en cl que sc lleva a cabo la eva¬ 
luation (Anthony, LeRcsche, Niaz, Von Korff 
y Folstein, 1982; Tombaugh, McDowell, 
Kristjansson y Hubley, 1996; Tsai y Tsuang, 
1979). A pesar dc sus limitaciones. el MMSE 
continua siendo la prueba mbs confiable y 
prdetica para la detecci6n dc demencia en an¬ 
cianos (Ferris, 1992). Debring, Van Gorp, Stuck 
y otros investigadores (1994) recomiendan 
su empleo como parte de una baterfa corta de 
deleccidn de la declinaciOn cognitiva en ancia¬ 
nos. En cl cuadro 9-14 sc resumen medias adi- 
cionales del estado mental geriOtrico. 




Evaluation neuropsicoldgica y geriatrics • 415 


MiniMentalur 


NOMBflE OEL FACCNTE 


Edad 


SOMBRE DEL EXAMINADOR 


AAos d* osiudo laimnadoa 


Ac«qu»se al pacrniM con miMlo y ain«o 
Piooud* 'iTun* olgun prcoiwns con lu msmortaT - 
*(.Pu«do hacarlo algunas pngumn iot»« hi mamonaT* 


FachaoaavaViaciCn 

□ Sf □ No 

□ Si □ No 


CALIRCACldN REACT! VO 


5 ( ) orientaciOn en tiempo 

Pregurso 

‘cCuNaaaiaAo_ 

masdalrto _ 

diadslaMmanar _ 


(I). 

<!).'« 

0)7" 


(I). 

(IX 


5 ( ) orientaciOn en luoar 

PraOkrta 

•(.OCndanoaenconoamos? t Cu4le«el«siado_ 

panada la oudad _ (I), adhcio . 

paoddadnooT-_ (|)7" 


(IX 


(IX 


(IX 


3( ) REQISTRO OE TRES PALABRAS 

Ooa ‘Eaculvicuidadoaamania VoysdscirlrMpaMyas. UsmlnpAalaa (Maputo da qu» ms datanga 
iLmo? Son las Mguanles. . POTRO (aspom un sagundo), COARTO (aspara 1*1 sagundo). NARANJA (upon 
un sagundo) cCuHas atan asaa palaoras? 

-( 1 ) 

- (!) 

- (») 

conscta. daspuOs wpilalas nasu qua el pacwna aa apwida las lias 


Concede un pixso pw cad* 


5 ( ) SIETES EN SERIE COMO PRUEBA DE ATENCION Y CALCULO 

Piagutta *Resia 7 da 100 y oonmia iaaiando a«iat da cada lasultado suOsecuania hasta qua la 

pdaquasadMonga t Cuomo ot I 00manoa7r _ 

Oga: 


•Proaiga" 


(IX - 
_ (IX 


(IX 
- (IX 


Pmmaycr 


30 


cepas sdkSjnafes do 
Mia sumon. ttame 
■ 4(617)567-1215 

01596 M FOLSTEIN 


RECUEROO OE TRES PALABRAS 
Piapsaa 

‘cCuOlaa luaion las Iras palaPrai qua la pedf qua racndaiar 
Conceda in piano per cada raspuanaccnecta _ 


(IX 


(IX 


(IX 


FlBura 9-13. Examen del estado mlnlmenlal. 

Puente: Folstein, M.. Fotsteln, S. y McHugh, P. (1975). Mini-Menial State: A practical method lor grading the cognitive 
stale ol patients lor the clinician. Journal o( Psychiatric Research. 12, 189-198. B copyright del Mini-Mental State 
Examination es propledad completa de Mini Menial LLC. una compahia de responsabllidad limltada en Massachusetts. 
Para Inlormacidn acerca de la obtencion de permisos para utiizacidn o reproduced del Mini-Mental Slate Examination. 
Pur lavor comunicarse con John Gonsalves, Jr., Admlnistrador del Mini-Mental LLC, en el 31 St. James Avenue, 
Suite 1, Boston, MA 02116. (617) 587-4215. © 1998 MMLLC. 
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Ccoperoavo 

Dspondoc 

Amjcoo 

VMnMWtt 
Audtodn doictereo 
Lenguii malema 


2 ( ) NOMBRES 

Preguns 

'iOuS as aslor (mu«lr» \n MpU)_ (I). es eilo?' (mueslis un rslot)__ 

1 ( ) REPETIClON 

Digs 

'AhoralovoyapadsqjoniptabisiBdtgo. tllslo? Por dorvde paces. pooo»* 

'Alton ualod to ropin'_ jjj 

3 ( ) COMPRESSION 

ogs 

‘Escuctre con aadado porquo voy a pocJria qua haga ma cose 

"Tome sals pupal con su mano irtjmreda (I), ortbUUo a la naiad (1) y cctoquaio an al pi»a* (1) 

1 ( ) LECTURA 

OQK 

•Poi lavor laa to sigjwnio y Isoga to qua dfco. psra no to dga on voi alia • 

Cierre los ojos 

l( ) EscntnjRA 

Olga: 

"Poi tavot tncrtbo in oradda ’ S al pactenie no raapondo. ttga Tscntm aobta al cAma' (1) 


I ( ) DIBUJO 

Oga "Pw lavot cogta asla dtwAo 



PUNTUAClOM TOTAL -Evahro d rvvot do cortcutncUi a to tatgo do un confenuo 



So«nno- 

Calupor 

Cam* 


ICACU 




si 

NO 


si 

NO 

funci6nporpoder 


□ 

□ 

Ootonoro con napacto 



Por tavor ro^sl’B los ttaloa cunodo ei pact«ri* 

□ 

□ 

al nival p»mo da lun- 
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Cuadro 9-14. Pruebas de estado mental utillzadas con pacientes geriatricos 


Prueba 

Contenido 

Qognistat 

Kiernan, Mueller y Langston (1997) 

Lenguaje, construcddn (copias), memoria, cdlculo 

y razonamiento/juicio 

lofonnation-Memory-Concentration (Informa- 
cldn-Memoria-Concentracidn) 

Blessed, Tomlinson y Roth (1968) 

Iniormacidn, orientacidn, concenlracidn 

Short Portable Mental Status Questionnaire 
(Cuestionario Portatil Breve del Estado 

Mental) 

Pfeiffer (1975) 

Informacidn, orientacidn, atencidn 

Dementia Rating Scale (Escala de calificacidn 
de la demencia) 

Matlis (1976) 

Atencidn, memoria, construcddn (copias), concep- 
tuacidn, fluidez verbal 

Test of Temporal Orientations (Prueba de orien- 
taciones temporales) 

Benlon, Sivan, Hamshor, Varney y Spreen (1994) 

Orientacidn 

Alzheimer's Disease Assessment Scale 
(Escala de Evaluacidn de la Enfermedad 
de Alzheimer) 

Rosen, Mohs y Davis (1984) 

Orientacidn, memoria, lenguaje, construcddn (co¬ 
pias) 

Cambridge Cognitive Examination (Examen 
Cognitivo de Cambridge) 

Roth, Tym, Mountjoy y colaboradores (1986) 

Orientacidn, memoria, lenguaje, construcddn (co¬ 
pias), atencidn, abstraccidn, porcepddn, cdlcuio 

Severe Impairment Battery (Bateria de dete¬ 
rioro grave) 

Saxton, McGonigle-Gibson, Swihart y colabora¬ 
dores (1990) 

Orientaddn, memoria, lenguaje, atencidn, interac- 
cidn social, construcddn (copias), praxis, per- 
cepddn visual. 

Iresumen 


1. Para prop6sitos de evaluacidn, el procesa- 
miento cognitivo se considera como la sc- 
cucncia que se sigue a travds de las siguien- 
tcs clapas: entrada sensorial, atencidn y 
conccntracidn, aprendizaje y memoria, 
habilidades de lenguaje o habilidades 
visocspaciales/de manipulacidn o ambas, 
funcioncs ejecutivas y salida motora (figu- 
ra 9-6). 

2. Por lo general, la evaluacidn de la entrada 
sensorial se logra a travds de la estimulaci6n 


unilateral y bilateral en las modalidadcs de 
tacto, oido y visidn. Las tareas ti'picas (p. 
ej., localizacidn de dcdos) son tan scncillas 
que las personas sanas pocas veces cometen 
errorcs. 

3. Las medidas del deterioro en la atencidn 
incluycn la rcsla de sietes en seric; la CPT, 
una familia de tareas de vigilancia por 
computadora; y la PASAT, una prueba con 
limites de ticmpo para la aritmdtica mental 
(suma de pares succsivos de dfgitos), la cual 
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es muy sensible a los efectos de la conmo- 
ci6n cerebral. 

4. Una rcspctada prueba dc la mcmoria es la 
WMS-III, que constituye una revisidn 
sustancial de la escala original publicada 
hace casi SO aiios. Con una estandarizacidn 
cuidadosa, la WMS-III consta de 17 
subpruebas, incluyendo algunas sobre el 
recuerdo sorpresivo media hora dcspuds de 
la aplicacidn original. 

5. Otra prueba ampliamenlc ulilizada dc la me- 
moria es la RAVLT, en la que se lee a la 
persona evaluada la misma lista de IS sus- 
tantivos concrctos en cinco ensayos conse- 
cutivos. El recuerdo se somele a prueba 
despuds de cada ensayo y tambidn despuds 
dc la aplicacidn de una lista interpolada de 
palabras. 

6. La afasia es cualquier des viacidn del dcsem- 
peiio en el lenguaje, producto dc dado 
cerebral. Las pruebas de la afasia [p. ej., la 
Reitan-Indiana Aphasia Screening Test o 
el Boston Diagnostic Aphasia Exam de 
Goodglass y Kaplan] evaliian, por lo co- 
mun, el discurso espontdneo, la repeticidn 
de oraciones y frases, la comprensidn del 
lenguaje hablado, la localizacidn dc pala¬ 
bras. lectura, escrilura, copiado y cdlculo). 

7. Las pruebas de la capacidad espacial y de 
manipulacidn incluyen pruebas de dibujo o 
copiado como el Test Guestdltico Visomo- 
tor y las pruebas de construccidn con cubos 
tridimensionales; ambos tipos son sensibles 
a los efectos del dano cerebral. 

8. Las funciones ejecutivas incluyen el andlisis 
ldgico, conccptuacidn, razonamiento, pla- 
nificacidn y flexibilidad de pensamiento. 
Pruebas utiles para la evaluacidn de las 
funciones ejecutivas incluyen el Test de 
laberintos Porteus; la Wisconsin Card 

^ TtRMINOS Y CONCERTOS CLAVE 

Conmocidn cerebral 
Enfermedad de Alzheimer 
Afasia 


Sorting Test y la Tinkertoy<E> Test, Hamad# 
asf debido a los materiales que utiliza. 

9. Las baterfas de pruebas neuropsicoldgic## 
incluyen por lo comun medidas de la salida 
motora como la Prueba de Golpetco con los 
Dedos de la baterfa Halstcad-Reitan. Es 
tfpico que la mano no dominante sea 10% 
mds lenta que la mano dominante; las des- 
viaciones con respecto a este patrdn pueden 
indicar una lesidn en el hemisferio opuesto 
al de la mano mds lenta. 

10. Otras pruebas motoras utiles incluyen cl Test 
no verbal de la Universidad de Purdue, que 
requiere que la persona examinada colo- 
que clavijas en orificios con la mano 
izquierda, mano derecha y despuds con 
ambas manos, y las (areas simples de tra- 
zado dc Ifneas, que llevan a cabo con faci- 
lidad la mayorfa de los nihos de 10 aiios. 

11. La LNNB consta de 269 reaclivos separados 
modelados dc acuerdo al trabajo de Luria y 
estandarizado dc manera formal. El autor 
de la prueba y sus colaboradores infor- 
man de excelentc confiabilidad y fuerte 
validez (p. ej., tasas de acierto de 80% o 
mejores en la identificacidn de personas con 
daiio cerebral). 

12. El Examen del Estado Mental (EEM) es una 
entrevista definida de manera aproximada 
que por lo general antecede a otras for¬ 
mas de evaluacidn psicoldgica y mddica 
Las dreas que se evaluan en el EEM incluyen 
orientacidn, memoria, pensamiento, senti- 
miento y juicio. 

13. Una prueba de detecci6n del estado mental 
que es de particular utilidad con ancianos 
es cl MMSE. Esta prueba de 30 reacti- 
vos tiene elevada confiabilidad y tasas de 
acierto en algunas poblaciones de 80 a 90% 
para la deteccidn de demencia en ancianos. 


p. 397 Apraxia p. 403 

p. 401 Funciones ejecutivas p. 406 

p. 402 l 
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En cste capftulo se esludian las aplica- 
ciones de las pruebas dentro de dos ambientes 
caracterfsticos: las escuelas y el sistema legal. 
Aunquc muy diversos en muchos sentidos, es- 
tos dos ambientes para la evaluacidn compartcn 
algunos aspectos escncialcs. En ambas areas, las 
normas legales ejercen una intluencia podcrosa 
y restrictiva sobre las prdcticas de evaluacidn. 


Cuestioncs como el diagndstico y clasificacidn 
adecuados son especialmente pertinentes. Por 
ejemplo, cuando se cvalda la discapacidad para 
el aprendizaje en un estudiante, cl psiediogo 
escolar observa pautas federates que circunscri- 
ben la definicidn de estos trastornos. De manera 
similar, cuando sc realiza la valoracidn de un 
cliente para establccer su competencia para so- 
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meterse a juicio, el psic6logo forense sigue las 
normas publicadas que dcterminan los Ifmites 
de la capacidad legal. En ambos casos, los pre- 
ccptos legalcs moldean, configuran y esta- 
blecen las prdcticas dc cvaluacidn. 

Seguramente, la cvaluacidn escolar y la 
forense comprcnden dos de los campos mas 
interesanles para las pruebas psicoidgicas. En el 
lema 10A, Evaluacidn escolar, sc toma en con- 
sideracidn el empleo dc las pruebas psico- 
logicas dentro de las escuelas para propdsilos 
como la deteccidn, evaluation y asignacidn es¬ 
pecial. En el temu 10B, Aplicaciones forenses 
de la evaluacidn, se analizan los desaffos uni- 
cos que enfrentan los psicdlogos forenses que 
lie van a cabo valoraciones dirigidas a un tribu¬ 
nal. Por supuesto, se revisan y catalogan las 
pruebas relacionadas. Pcro mas importante 
cs el hccho dc que se centra la atencidn sobre 
las cuestiones y rctos cspeciales que se enfren¬ 
tan dentro de estos medios peculiarcs. 

A pesarde que es cicrto que una de las prin- 
cipalcs aplicaciones de las pruebas escolares es 
la valoracidn de las discapacidades para el apren- 
dizajc (que se analizan a profundidad en las si- 
guientes secciones), las psicdlogos proporcionan 
muchos otros servicios de evaluacidn para las 
escuelas. fistos incluyen la detecci6n dc la pre- 
paracidn para la escuela, la valoracidn del defi¬ 
cit dc atcncidn y otros problcmas conductualcs 
y el examen dc intcligcncia dotada. En las siguien- 
tes secciones se revisan estos temas. En el tema 
7 A, Pruebas con poblaciones cspeciales, sc dcs- 
criben las prdcticas adicionales de evaluacidn 
escolar, como la valoracidn del retraso mental 
y la evaluacidn de nifios con discapacidades. 

0 detecci6n de la preparao6n 

PARA LA ESCUELA 


El propdsito dc la detcccion es identificar a ni¬ 
fios que cstdn en riesgo, dc modo que se les 
pueda canalizar a una valoracidn mds comple- 
ta (Kamphaus, 1993), £pero “en riesgo" de qud? 
La respuesta general tiene que ver con la pro- 
babilidad de reprobacidn en los afios iniciales 


de la educacidn primaria. La nocidn de riesgo 
se vincula en gran medida con el concepto de 
demora en el desarrollo, el cual sc reficre a los 
nifios cuyo desarrollo cognitivo estd muy po r 
debajo dc las expectativas para su edad. Algunos 
nifios identificados con esta etiqueta “se ponen 
al dia" durante cl curso dc su vida. Para cllos, cl 
tdrmino demora del desarrollo es una designacidn 
apropiada; seguramente es una etiqueta mds op- 
timista y menos afrentosa que la dc retraso 
mental —que con frecuencia cs la ultima con- 
secuencia de la demora en el desarrollo. 

Los nifias con inteligencia baja cstdn en 
riesgo sustancial de fracasar en la escuela, lo 
que explica por qu£ las pruebas individuals 
de inteligencia representan un papcl importan¬ 
te en la valoracidn de los nifios precscolares, 
pcro requieren de un compromiso sustancial de 
tiempo (hasta dos horas) y deben aplicarlas pro- 
fesionalcs cuidadosamcntc entrenados; por lan- 
to, y debido a razones dc fndolc prdctica, las 
pruebas individuates de inteligencia no son adc- 
cuadas como instrumentos de deteccidn. 

El instrumento ideal de deteccidn es una 
prueba cotta que puedan aplicar los maestros, 
enfermcras escolares y otros individuos que tic- 
nen un entrenamiento limitado en cuestiones 
dc cvaluacidn. Ademds, una prueba sensible de 
deteccidn es aquella que proporciona una pun- 
tuacidn de corte precisa en la clasiftcacidn dc 
los nifios como normalcs o en riesgo. En cl con- 
lexto de las pruebas dc detecci6n pueden ocurrir 
dos errores. Los nifios normales que fallan en 
la prueba sc canalizan como casos de falso posi- 
li vo (debido a que sc les clasifica de manera equi- 
vocada como positivos en cuanto a discapacidad 
potencial). Los nifios en riesgo que pasan la 
prueba se considcran como casos de falso ne- 
gativo (porque se les clasifica de manera in- 
adecuada como negativos en relacidn con la 
discapacidad potencial). El lector debe teneren 
mente que el proposito de la dcteccidn cs sim- 
plemente la idcntificacidn de nifios que necesi- 
tan una valoracidn adicional, lo cual signifies 
que los casos de falso positivo recibiritn mayor 
valoracidn. De aquf que la clasiftcacidn enonea 
de falso positivo conduzca en pocas ocasiones 
a consecuencias indeseablcs. No obstante, es 
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tfpico que los casos de falso negalivo no reciban 
u na valoraciAn posterior, de modo que este tipo 
de clasificaciAn crrAnca cs potcncialmcntc mAs 
grave —debido a que un nino cn situaciAn de 
necesidad se considera como normal. Glascoe 
(1991) recomicnda que un instrumento util de- 
berfa producir una tasa de fatsos ncgativos mc- 
nor a 20% (to cual implica que se detectarA con 
|a prueba a 80% de ninos que en realidad estdn 
en riesgo) y una tasa todavta menor de falsos 
posilivos, menor de 10% (lo que significa que 
90% de los ninos normalcs pasardn la prueba). 

Las pruebas de dctccciAn son breves por 
definicion y, por tanto, estdn propensas a erro- 
res de mediciAn. Incluso con las mejores prue¬ 
bas disponiblcs, algunos ninos que merecen 
atcnciAn pasardn desapercibidos (casos de fal¬ 
so negativo) y no se reconocerd que necesitan 
intcrvenciAn hasta mucho despuds dc haber 
iniciado la educaciAn primaria. Sin embargo, 
si una prueba de detecciAn identified una 
alia proporciAn de casos positivos verdaderos 
—preescolares clasificados en riesgo, quiencs 
necesitan realmente los servicios especiales o 
una demora en el ingreso a la escuela— dicha 
prueba satisface un propAsito util. 

INSTRUMENTOS PARA DETECa6N 
PREESCOLAR 

Aunque se han producido doccnas de instrumen- 
tos para detectar las demoras en el desarrollo 
(Malcolm, 1998), aquf se limita el andlisis a al- 
gunas dc el las: los Developmental Indicators for 
the Assessment of Learning -Revised, DIAL-R 
(lndicadores del Desarrollo para la GvaluaciAn 
del Aprendizaje Revisados), la Denver II. una 
revisiAn dc la Denver Developmental Screening 
Test -Revised (Prueba Denver dc DetecciAn del 
Desarrollo -Revisada), y la Home Observation 
for the Measurement of the Envimment, HOME 
(ObservaciAn en el Hogar para la MediciAn del 
Ambiente). Las primeras dos utilizan enfoques 
convcncionales para la identificaciAn de la demora 
en el desarrollo, mientras el tercer instrumento, 
el HOME, engloba una desviaciAn radical con 
respccto a los procedimientos tradicionalcs. 


DIAL-R 

Los Developmental Indicators for the Assessment 
of Learning -Revised, DIAL-R (lndicadores del 
Desarrollo para la EvaluaciAn del Aprendizaje 
Revisados) son un procedimiento de detecciAn 
que se aplica de manera individual y que se di- 
senA para la detecciAn rApida y eficaz de los 
problemas del desarrollo (o la intcligencia dota- 
da) en ninos preescolares de 2-0 a 5-11 aiios de 
edad (Mardell-Czudnowski y Goldenbcrg, 
1990). La prueba analiza cl desempeiio de los 
niftos en tres dominios del desarrollo: motrici- 
dad, conccptos y lenguaje. Cada uno se evalua 
a travds dc ocho reactivos que se subdividen cn 
tareas separadas. Los DIAL-R tambien propor- 
cionan una evaluaciAn por observaciAn de los 
problemas socioemocionales (p. ej., llanto o 
gimoteo, dislracciAn, resistencia, indisciplina), 
pero de manera mcnos rigurosa. Los siguientes 
son ejemplos de reactivos de la prueba dentro 
de los tres dominios del desarrollo: 

1. Motricidad: cachar, saltar, construir, cortar, 
copiar formas y lelras, cscribir cl propio 
nombre. 

2. Conceptos: identificaciAn de partes del cuer- 
po, nombrar colorcs, contar cubos, palabras 
de posiciAn, nombrar letras, clasificar. 

3. Lenguaje: decir palabras individuales, dar 
sus datos personates, decir sustantivos, 
clasificar alimentos, solucionar problemas 
orales, extensiAn de oraciones habladas. 

La calificaciAn para algunos reactivos es sepa- 
rada y objetiva, mientras que para otras pregun- 
tas los criterios de calificaciAn del manual dejan 
oportunidad para la intcrprctaciAn subjetiva, lo 
cual disminuye la confiabilidad del instrumen¬ 
to. La calificaciAn total se obtiene de la suma 
de las tres puntuacioncs dc Area. Para cada pun- 
tuaciAn de Area y tambidn para la calificaciAn 
total, el manual proporciona puntuaciones de 
corte para asignar al nino a 1 de 3 grupos dc re- 
sultado denominados “aprobado”, “problema 
potcncial" o “potencialmente avanzado". 
Las puntuaciones de corte de los DIAL-R es- 
tAn disponibles para tres grupos normativos: 
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caucusico, minoritario y ccnsal (grupos com- 
binados). Las mucstras de estandarizaci6n son 
muy similares a los datos del ccnso dc 1990 en 
cuanto a antecedentes cducativos de los padres. 

La confiabilidad dc los DIAL-R cs adccua- 
da, en vista de que es una prueba breve con 
propdsitos dc detcccidn. Los datos de confia¬ 
bilidad test-retest (N = 65) indican coeficientes 
promedio que van de .76 para el dominio dc 
molricidad al .90 para conceptos. La validcz del 
instrumento sc ha cstimado en las pautas fami- 
liares dc contcnido, conslructo y rclacionada 
con el critcrio. La validez de contenido se con- 
sidera alta y se obtuvo a travds de un panel de 
ocho expertos que proporcionaron revisiones 
del contenido y ayudaron a climinar los reac- 
tivos inapropiados o tcndenciosos. La validez 
de constructo es mds cuestionablc debido a que 
la evidencia del analisis factorial no parece sus- 
tentar la validcz dc los tres dominios como 
subpruebas independientes. 

Es con respccto a la validez rclacionada con 
el criterio que los DIAL-R han hecho surgir el 
mayor escepticismo. El valor dc una prueba dc 
dcteccidn puede juzgarsc mejoren funcibn del 
grado al que identiftca con precision a los ni- 
iios que nccesitan mayor evaluaci6n relativa al 
dcsarrollo. Una prueba con buena validez rela- 
cionada con el criterio clasifica de mancra co- 
rrecta a una alta proporcidn de nifios que en la 
actualidad obticncn puntuaciones bajas en prue- 
bas mds amplias de demora del desarrollo (va¬ 
lidcz concurrente) o que postcriormente se 
confirma que presentan dichos problcmas (va¬ 
lidez predictiva). Un cstadistico util para csti- 
mar la validez relacionada con cl criterio es la 
sensibilidad. que es la proporci6n dc casos pro- 
blema confirmados que se “senalaron" de ma¬ 
ncra precisa como tales. Por dcsgracia, los 
DIAL-R no constituyen una prueba cficaz en 
este sentido. El manual cita una variedad de es- 
tudios que rcvelan sensibilidad dbbil, en ge¬ 
neral dentro del rango dc 25 a 57%. Lo que 
esto significa es que de aquellos nifios que en 
realidad tienen un problema, s6lo se identified 
de 25 a 57% como “problema potcncial" con 
los DIAL-R. La prueba funciona mejor en la 
idcntificacidn corrccta dc nifios normales como 


talcs, con una cspccificidad de cerca dc 90%. 
No obstante, la baja sensibilidad implica que 
muchos nifios en nccesidad dc consideration 
especial pasaran desapercibidos para esta 
prueba (Cooper y Shepard, 1992). 

DENVER II 

La Denver II (Frankenburg, Dodds, Archer y 
col., 1990) es una vcrsi6n actualizada de la muy 
popular Denver Developmental Screening Test 
-Revised (Prueba Denver dc Dctccci6n del 
Dcsarrollo -Revisada; Frankenburg, 1985; 
Frankenburg y Dodds, 1967). Es probable que 
dsta sea la herramienta dc dcteccidn pedidtri- 
ca mds conocida e investigada en EUA. El ins¬ 
trumento es popular a nivel mundial —se le ha 
traducido a 44 idiomas diferentes. Adecuada 
para lactantes y nifios de 1 mes a 6 afios de edad, 
la prueba consta de 125 rcactivos en cuatro 
dreas: personal-social, motora fina-adaptativa, 
lenguajc y motora gruesa. Los reactivos son una 
mczcla de informes de los padres, obtcnci6n 
directa de conductas y observation. Cada uno 
cstd dispuesto en orden cronoldgico en la 
prueba segun la edad del nifio, y sc califica con 
aprobado/reprobado. La prueba comienza a 
un nivel apropiado para la edad y continua hasta 
que el nifio falla en ires reactivos. El tiempo 
total de valoraci6n es de 20 minutos o menos. 

A diferencia de otras pruebas de detection, 
la Denver D no produce un cociente o puntuaciOn 
del dcsarrollo. En vez de ello, los rcsultados en 
cerca de 30 reactivos apropiados para la edad 
proporcionan una puntuaciOn que sc puede 
interpretar como normal, cuestionable o anor- 
mal, con refcrencia a normas basadas en la 
edad. Tambidn se incluye una catcgorfa de “ines- 
table". La muestra dc estandarizacibn se aplied 
a 2 096 nifios, todos del estado de Colorado, 
cstratiOcados conforme a edad, raza y nivel so- 
cioeconbmico. 

En reconocimicnlo a que ningun instrumcn- 
to es perfectamentc confiable ya que los nifios 
cambian a lo largo del tiempo, los autorcs de la 
Denver II recomicndan la repetition de la prue¬ 
ba a intervals de aproximadamente seis meses 


j 
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hasta los dos afios dc cdad, y despuds cada 
aflohasta los cinco afios. Se informa que la Denver 
|| tienc una confiabilidad sobrcsaiicnte para una 
prueba breve de deteccidn. La confiabilidad 
intercalificadores entre calificadores enlrenados 
luvo un promedio notable de .99. La confia¬ 
bilidad test-retesl para la calilicacidn total cn 
u n intcrvalo dc 7 a 10 dias promcdid .90. 

La prueba Denver posec cxcclente validez 
dc contenido en cuanto a que las conductas 
examinadas tienen el reconocimiento de las au- 
loridades en desarrollo infantil como indica- 
dores importantes del desarrollo. No obstante, 
las categorfas de interpretacidn de la prueba 
(normal, cuestionablc, anormal) se basaron cn 
el juicio clfnico y, por tanto, esperan un cstudio 
adicional para validacidn. Algunosestudios ini- 
ciales hacen surgir preocupaciones importan¬ 
tes. Glascoe y Byrne (1993) valoraron a 89 
nifios en ambientes de cuidado diurno que te- 
nfan de 7 a 70 meses de cdad. Con base cn una 
amplia valoracidn independiente, cn 18 dc cllos 
se confirmd la presencia de demoras del desa- 
rrollo de acuerdo con las definiciones federates 
para trastomos discapacituntes (p. ej., demoras 
en cl lenguaje, retraso mental y autismo). Aun- 
que la Denver II funciond bien en la identifica- 
cidn correcta de 15 de los 18 nifios en riesgo, el 
instrumento tuvo un desempefio dcficiente con 
los nifios normales. Dc hecho, 38 dc los 71 ni- 
nos normales fallaron en la prueba y se les cla- 
sified como cueslionables o anormales. En 
general, casi 4 de cada 6 ninos que realizan la 
prueba sc canalizarfan para cvaluacidn adicio¬ 
nal. y de los 4, sdlo 1 tendrfa una verdadera 
(liscapacidad. Los investigadores concluyen que: 

Esto causa ansledad y gastos Innecesarios para 
los padres, desperdicia preciosos recursos diag- 
ndsticos y de intervencidn, y deja a los profesio- 
nales con preguntas sin responder acerca de 
la condickJn de desarrollo de los ninos, tanto an¬ 
tes como despuds de la deteccibn. 

Estos autores recomiendan mayores estudios de 
validacidn dando la importancia adecuada y 
ditninando en lo posible algunos reactivos an¬ 
tes dc que la prueba pueda utilizarsc de manera 

general. 


HOME 

La Home Obsen’ation for Measurement of the 
Environment, HOME(Observaci6n en cl Hogar 
para la Medicidn del Ambienle), conocida popu- 
iarmente como Inventario HOME, es con toda 
probabilidad el fndice mils utilizado del ambicn- 
tc de los ninos. Basada en la observacidn dentro 
del hogar y con una entrevista con la principal 
persona encargada del cuidado del nifio, el instru¬ 
mento proporciona una medicidn de los ambien- 
tes ffsico y social de este. El Inventario HOME 
viene en tres formas: Lactantes e Infantes, Pri- 
mera Infancia e Infancia Media. Las tiltimas 
cdiciones del instrumento, con fecha de 1984, 
surgieron despuds de 15 afios de revisidn y re- 
finamiento metddicos (Caldwell y Richmond, 
1967; Caldwell y Bradley, 1984. 1994). 

ANTECEDENTS Y DESCR1PCJ6N 

Antes del desarrollo del Inventario HOME, In 
medicidn de los ambientes dc los nifios se ba- 
saba, cn gran medida, cn datos demogrdficos 
como cducacidn, ocupacidn, ingresos y lugar de 
residencia de los padres. Con frecuencia, estos 
Indices se combinaban en una medida acu- 
mulativa conocida como clase social o nivel socio- 
ccondmico (NSE). Por ejemplo, Hollingshead 
y Rcdlich (1958) desarrollaron un continuo dc 
clase social derivado de la residencia, ocupa- 
cidn y educacidn del jefe dc familia. La pun- 
tuacidn dc NSE de una familia cuyo jefe traba- 
jara cn un empleo de oficina, tuviera diploma 
de educacidn media y vi vicra cn un drea residen- 
cial de nivel medio, secalcularfa de la siguiente 
manera (Hollingshead y Redlich, 1958): 


Factor Valor x Pondera- = Puntua- 



dc 

cion del 

cion 


Escala 

factor 

parcial 

Residencia 

3 

6 

18 

Ocupacidn 

4 

9 

36 

Educacidn 

4 

5 

20 

Indice de NSE 


= 74 





424 • Evaluation psicologlca: Historia, principios y aplicaciones 


(Capilulo IQ) 


Para propdsilos de investigation, los cicntiTicos 
sociales pueden categorizar a las familias en 
una jerarqufa de cinco clases sociales (clases I 
a V) con base en la calificacidn total. El lector 
observard que la medicidn de Hollingshcad y 
Redlich sc obtuvo complctamcntc dc los indi¬ 
ces de estatus. La suposicidn no cxpresada es 
que cstos indices reflejan, de manera indirecta, 
una variacidn ambiental significati va. Dicho en 
tdrminos dircctos, los dcfcnsores del NSE como 
medida ambiental creen que, en promedio, los 
ninos de una clase social mds alia lendrdn un 
ambiente mejor que aqudllos de una mds baja. 

En contraste con el enfoque del NSE, el 
fndice HOME sc dcsarrolld para proporcionar 
una medida directa dc proceso dc los ambicntes 
infantiles. La filosoffa gufa de este instmmento 
cs que la cvaluacidn dirccta dc las expericncias 
dc los ninos es un mejor fndice del ambiente en 
el hogar que medidas indircctas como la ocupa- 
ci6n y education de los padres. Aunquc cs cicrto 
que la clase social —como lo representa la ocu- 
pacidn, educaciOn y residencia— proporciona 
una medida oblicua de la riqueza del ambiente, 
los autorcs del Invcntario HOME discutirfan 
que la cvaluaciOn directa de las experiencias 
de los ninos proporciona un fndice mds preci- 
so de las variaciones en el ambiente hogareno. 
Asf, la evaluacidn con este invcntario implica, 
en parte, la observaci6n directa de los ambientes 
hogarenos de los ninos para determinar si cier- 
tos tipos dc intcraccioncs y expericncias cstdn 
presentes o ausentes. Por ejemplo, durante una 
visita de una hora, el examinador observa si cl 
padre o la madre se comunican espontdneamen- 
te con el nifio cuando menos en cinco ocasiones, 
determina si 6ste tiene cuando menos 10 libros 
o discos con cuentos y evalua si el vecindario 
es estdticamente agradable segun normas deta- 
lladas, por citar sdlo algunos ejcmplos. 

El propdsito del Invcntario HOME es medir 
la calidad y cantidad dc estimulaciOn y apoyo 
para el desarrollo cognitivo, social y emocio- 
nal que sc cncuentra disponiblc para cl nifio en 
su hogar. Las escalas y reactivos del HOME se 
obtuvieron de una lista de procesos ambicntalcs 
idenlificados en la invcstigaciOn y tcorfa consi- 
dcrados importantes para el desarrollo dpt i mo 


en la infancia (Caldwell y Bradley, 1984). Estoi 
procesos promotores del crecimicnto incluyen 
la satisfaccidn de ncccsidades bdsicas; contac- 
to frecuente con un ni'imero relativamente p e . 
queno dc adultos; un clima emocional positi- 
vo que fomente la confianza en sf mismo y en Inn 
demils; information sensorial apropiada, variada 
y con un cierto patrOn; consistencia en las res- 
puestas ffsicas, verbales y emocionales de 1% 
dentils; un mfnimo de restricciones sociales sobre 
la conducta dc cxploraciOn y motora; esiructura 
y orden en el ambiente cotidiano; dar c inter- 
pretar experiencias culturales variadas de adul¬ 
tos; matcrialcs y ambientes apropiados de juego; 
contacto con adultos que valoren los logros y 
programacibn acumulati va de expericncias que 
cstdn al nivel dc desarrollo del nifio (Caldwell 
y Bradley, 1984). Por tanto. en pocas palabras.cl 
propdsito del HOME consiste en medir patrones 
especfficos y designados de nutrici6n y estimu- 
lacidn disponiblcs para los ninos en cl hogar. 

Para llenar el Inventario HOME, el exami¬ 
nador debc observar al nifio y a la persona cn- 
cargada dc su cuidado (por lo general la madre) 
en interacciOn dentro del ambiente del hogar. 
Las calificacioncs dc algunos dc los reactivos 
del inventario sc logran dc la obscrvacidn del 
ambiente ffsico. Ademds, la respucsta para al¬ 
gunos dc cllos se basa en autoinformes de la 
persona encargada del nifio. Los reactivos se 
califican de manera dicotOmica, 1 para presen- 
cia, 0 para ausencia. Por ejemplo, un reactivo 
pregunta si se incluyc al niho en la compra dc 
abarrotes al menos una vcz por semana. El 
manual del invcntario alienta un enfoque rela 
jado, semicstructurado, para la observacidn y 
entrevista (Caldwell y Bradley, 1984). Complc- 
tar el inventario rcquicre cerca dc una hora. 

El HOME estd disponible en tres formas: 
Lactantcs e Infantes (0 a 3 anos), Infancia Tern- 
prana (3 a 6 anos) c Infancia Media (6 a 10 
anos). La forma para Lactantcs e Infantes consta 
dc 45 reactivos organizados en las siguientes 
seis subesealas: 

Rcspuesta emocional y verbal del padre. 

Aceptacidn de la conducta del nifio. 

Organization del ambiente. 
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Suministro de matcriales apropiadcxs de juego. 

Participacidn del padre o madrecon cl nifio. 

Variedad de estimulacidn. 

La versidn para Infancia Temprana dene SS 
feactivos organizados en ocho subescalas, e 
Infancia Media 59 reactivos distribuidos cn 
ocho subescalas. En el cuadro 10-1 sc listan 
|os reactivos para la versidn del Inventario 
HOME dirigida a Lactantcs e Infantes. En 
Caldwell y Bradley (1984) se pueden cncon- 
trar detalles acerca de los reactivos espccfficos 
que se incluyen en el HOME. 

CARACTERIST1 CAS TECNICAS 

Las normas relacionadas con el Inventario 
HOME estdn disponibles en varias fuentes. Para 
la versidn de Lactantes e Infantes, Caldwell y 
Bradley (1984) informan de medias y desvia- 
cioncs estandar por subeseala para 174 fami- 
lias de Little Rock, Arkansas. En comparacidn 
con la poblacidn general, esta muestra parece 
sobrerrepresentar a las familias de NSE bajo; 
por ejemplo, 34% de ellas estaban en la benefi- 
cencia del estado, y 29% eran hogares de un 
solo padre. Para la versidn de Infancia Tempra¬ 
na, los datos de estandarizacidn se obtuvieron 
con 232 familias en Little Rock, con una repre- 
sentacidn excesiva similar de familias de NSE 
bajo. En cl caso de la versidn para Infancia 
Media, Bradley y Rock (1985) informaron de 
medias y dcsviacioncs estandar para 141 fami¬ 
lias de Little Rock. Aproximadamente la mitad 
de dstas eran afroestadounidenses y las restan- 
tes caucdsicas; nihos y niflas tuvicron una re- 
prcscntaci6n igual en la muestra. Sc consider^ 
que estas familias eran representativas de to- 
das aquellas que erfan a nifios en edad cscolar 
en Little Rock, Arkansas; no obstante, en las 
Ires versiones es evidente que las muestras de 
estandarizacidn proporcionan s6lo normas lo¬ 
cales. Estos datos pueden ser utiles como pun- 
los de referenda, pero no deben igualarse con 
una muestra nacional, alcatoria y estratificada. 

La confiabilidad del Inventario HOME sc 
ha demostrado de diferentes maneras, en parti¬ 
cular para la versidn de Lactantes e Infantes, 


que es la que se analiza aquf. Los autorcs sciia- 
lan que los estudios text-re test a corto plazo son 
inapropiados, dado que es bastante probable que 
la persona que responde al inventario recuerde 
una respuesta cspecffica dada a una pregunta, 
lo cual inflarfa de mancra artificial las correla- 
cioncs test-retest (Bradley y Caldwell, 1984). 
Los mdtodos utilizados para la cvaluacidn de la 
confiabilidad incluyeron concordancia interob- 
servadores, consistency interna y cocficientes 
de estabilidad test-retest de amplio rango para 91 
familias de la muestra de estandarizacidn. Por 
definicidn, se informa que la concordancia inter- 
observadores para los reactivos de subeseala es 
de 90% o mayor, dado que dste es el criterio de 
entrenamiento para los nuevos calificadores. 
Los estimados de consistencia interna con la 
fdrmula Kuder-Richardson 20 van de .67 a .89 
para todas las subescalas, excepto Variedad de 
estimulacidn, la cual produjo un coeficicn- 
te de sdlo .44, que sc debid al pequeno numero 
de reactivos en la subeseala (cinco). Los datos 
test-retest se obtuvieron con 91 familias eva- 
luadas cuando su lactante/infante tenfa 6, 12 y 
24 meses de edad. Los coeficientes indicaron 
un grado de modcrado a alto de estabilidad para 
las subescalas, dondc la mayor parte de las co- 
rrelaciones sc colocaron cn los rangos de .50. 
.60 y .70. La corrclacidn entre la punluacidn 
total de la prueba a los 12 y 24 meses de edad 
llegd a un respetable .77. 

La validez del Inventario HOME se ha con- 
solidado a travds de datos de investigacidn que 
mucstran comelaciones modestas con los indices 
de NSE. Dcbido a que cl inventario sc propuso 
como un fndicc mds significativo y sensible del 
ambiente que la clasc social, las puntuaciones 
del HOME deberfan rclacionar.sc de mancra 
significativa, pero no elevada, con los Indices de 
NSE. En el caso de la versidn para Lactantes e 
Infantes, las correlaciones entre las subescalas 
del Inventario HOME y el NSE se encuentran 
principalmcntc cn los rangos de .30 y .40, mien- 
tras que aquella entre la puntuaci6n total y el 
NSE es de .45 (Bradley, Rock, Caldwell y 
Brisby, 1989). 

Las calificaciones del HOME tambidn 
muestran relaciones fuertes y confirmatorias 
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(Capitulo W) 


Cuadro 10-1. Llsta de subescalas y reactivos para la versldn 
de Lactantes e infantes del Inventario HOME 


Inventario HOME 

Coloque un signo de mds (+) o monos (-) en la casilla junto a cada reactivo si la conducta se observe 
durante la visits o si el padre o madre Informa que las condiciones o hechos son caracterfsticos del 
ambiente en el hogar. Anote el subtotal y el total en la cara frontal de la hoja de registro. 


I. RECEPTIVIDAD emocional y verbal 

□ 1. El progenitor vocaliza de manera espon- 

t£nea hacia el nino dos voces 

□ 2. El progenitor responds verbalmente a las 

vocalizaciones del nino 

□ 3. El progenitor dice al nino el nombre del 

objeto o persona durante la visits 

□ 4. El habla del progenitor es precisa y audible 

D 5. El progenitor inicia intercambios verbales 
con el visitante 

□ 6. El progenitor conversa libremente y con fa- 

cilidad 

□ 7. El progenitor permite que el nino parlicipe 

en juego "desordenado" 

□ 8. El progenitor alaba en lorma espontanea al 

nino al menos en dos ocasiones 

□ 9. La voz del progenitor transmits sentimientos 

positivos hacia el nifio 

□ 10. El progenitor acaricia o besa al nino al me¬ 

nos una vez 

□ 11. El progenitor responde de manera positiva 

a la alabanza del visitante hacia el nino 

□ Subtotal 

II. ACEPTACldJN de la conducta del nifio 

□ 12. El progenitor no le grita al nino 

Q 13. El progenitor no express moleslia u hosti- 
lldad hacia el nino 

□ 14. El progenitor no golpea al nino durante la 

visita 

□ 15. No m£s de un caso de castigo ffsico durante 

la ultima semana 

□ 16. El progenitor no regaha o critica al nifio du¬ 

rante la visita 

□ 17. El progenitor no interfere o restringe al nino 

en mds de Ires ocasiones 


□ 18. Est£n presentes y visibles cuando menos 

10 libros 

□ 19. La familia liene una mascota 

□ Subtotal 

III: ORGANIZACI6N del ambiente 

□ 20. Uno de Ires sustitutos regulares propor- 

ciona cuidado alterno 

□ 21. Se lleva al nifio a la tienda de abarrotes 

cuando menos una vez por semana 

□ 22. El nifio sale de casa cuando menos cua- 

tro veces por semana 

Q 23. Al nino se le lleva con regularidad al con- 
sullorio del medico o a la clfnica 

□ 24. El nifio tiene un lugar especial para sus 

juguetes y lesoros 

□ 25. El ambiente de juego del nifio es seguro 

□ Subtotal 

IV. Proporcionar MATERIALES DE JUEGO 

□ 26. Juguetes o equipo para actividad muscular 

□ 27. Juguete para empujar o jalar 

□ 28. Carreola o andadera, carrito, patineta o 

triciclo 

□ 29. El progenitor le proporciona juguetes al nifio 

durante la visita 

□ 30. Equipo de aprendizaje apropiado para la edad 

—munecos suaves o para role-playing 

□ 31. Facilitadores del aprendizaje —mdvil, mesa 

y sillas, silla alia, corralito 

□ 32. Juguetes para coordinacidn simple ojo-mano 

□ 33. Juguetes para coordinacion compleja ojo- 

mano (aquellos que permiten combina- 
ciones) 

□ 34. Juguetes para literatura o musica 

□ Subtotal 
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Cuadro 10-1. Lista de subescalas y reactivos para la version 
de Lactantes e infantes del Inventario HOME 
(continuacion) 


V. PARTICIPAClON de los padres con el nifio 

0 35. El progenitor manliene al nino dentro de 
su rango de vision, lo mira con trecuencia 

0 36. El progenitor le habla al nino mientras 
realiza las tareas del hogar 

0 37. El progenitor alienta conscienlemente el 
progreso del desarrollo 

0 38. El progenitor invents juguetes que tienen 
valor a traves de la alencion personal 

0 39. El progenitor estructura los periodos de 
juego del nifio 

0 40. El progenitor le proportions al nino juguetes 
que lo desafian a desarrollar nuevas 
habilidades 

0 Subtotal 


VI. Oportunidades de VARIEDAD 
O 41. El padre proportions cierto cuidado diaria- 
mente 

0j 42. El progenitor lee cuentos al nino al menos 
Ires voces por semana 

□ 43. El nifto toma cuando menos una de sus 

comidas diarias con la madre o el padre 

[0 44. La familia visits a familiares o recibe visitas 
una vez al mes aproximadamente 

□ 45. El nino liene Ires o mds llbros propios 
G Subtotal 

I I PUNTUACI6N total 

Para el fraseo completo de los reactivos, por favor 

ref id rase al Manual de aplicacion. 


Fu*nt«: Reproducido con autorizacktnde Caldwell, B M y Bradley. R H (1984) Home Observation tor M#osure<mnt ot the Environment 
Ullle Rock AR: University ol Arkansas at Little Rock 


de la teorfa con criterios externos apropiados 
que incluyen desarrollo del lenguaje y cognitivo, 
fracaso escolar, intervencidn terapeuttea y re- 
traso mental (Caldwell y Bradley, 1984). Las 
correlactones entre las puntuacioncs del HOME 
y medtdas intelecmales como las Bayley Scales 
of Infant Development (Escalas de Desarrollo 
Infantil Bayley) y la Stanford-Binct son parti- 
cularmcnte informativas. Bradley y Caldwell 
(1984) llcvaron a cabo un estudio longitudinal 
con 174 familias.encl cual aplicaron el HOME 
a los 6. 12 y 24 meses de edad y correlacionaron 
cstas calificaciones con el fndice de Desarrollo 
Mental dc Bayley (MDI) a los 12 meses y con 
el Cl de la Stanford-Binet a los 36 y 54 meses 
dc edad. El patr6n de correlaciones indict) una 
validcz predictiva mis alta que la concurrente, 
es deeir, las correlaciones entre el HOME y el 
Cl a los 36 y 54 meses de edad fucron mayores 
que aqudllas entre el HOME y el MDI a los 12 
meses de edad (cuadro 10-2). Los estudios ana- 
Iftico factoriales del HOME tambidn sustentan 


la validcz de constructo dc este instrumento 
(Bradley, Mundfrom, Whiteside y colaborado- 
res, 1994; Mundfrom, Bradley y Whiteside, 
1993). 

Adcmis de su utilidad como herramienta 
de invcstigacidn, el HOME representa una pro¬ 
mesa como instrumento clfnico. Dcbido a que 
las calificaciones bajas en el HOME predicen 
nesgo dc discapacidad intelectual, el inventa¬ 
rio puede utilizarsc para identificar a nifios para 
quiencs serfa apropiada la intcrvencidn terapdu- 
tica. Este tipo de intervencidn es mas que sdlo 
una aplicaci6n humanista de los dcscubrimien- 
tos de investigacidn —puede ser un requisito 
de ley: 

Entre las nuevas razones mas apremiantes para 
Investigar el ambiente de los nifios con disca- 
pacidades es el requisito en la ley pubtlca 99- 
457 do que todos los planes de servicio para los 
nifios en edad escolar que tienen discapacidades 
induyan un componente para los padres. Ya no sa¬ 
rd suficiente con tener un plan de regularizacidn 
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1 

(Capitulo 10) 


Cuadro 10-2. Correlaciones entre 
las puntuaciones del HOME a los 12 
meses y puntuaciones cognitivas 
a los 12, 36 y 54 meses 


Subescala 
del HOME 

MDI a los 
12 

meses 

Cl a los 
36 

meses 

Cl a los 
54 

meses 

Receptividad 

.15 

.39* 

.34* 

Restriccibn 

.01 

.24* 

.21 

Organization 

.20 

.39* 

.34* 

Materiales de 
juego 

.28* 

.56* 

.52* 

Participacibn 

-28* 

.47* 

.36* 

Variedad 

.05 

.28* 

.32* 

Puntuacibn 

total 

.30* 

.58* 

.53* 


*p< 05 


Notn: MDI se roliora al Indce de Dcsarrollo Menial de las Bayley 
Scales of Inlant Development (Escalas Bayley de DesarroDo 
Inlanlil); el O es de la Slanford-Binet 

Fucnto: Reproducido con autorizacidn de Bradley. R. H. y 
Caldwell. B M. (1904) 174 children: A study ol me relationship 
between home environment and cognitive development during 
the first 5 years En AW Gottfried (ed) Home environment and 
early cognitive development. Longitudinal Research Orlando. FL 
Academic Press 


dirigido en exclusiva al nirto. Tarnbien detoen in- 
clulrse planes para la particlpacibn y desarrollo 
do las capaddades de los padres (Bradley, Rock, 
Caldwell y Brisby, 19B9). 

En resumcn, el Inveniario HOME es promete- 
dor no s6lo en cuanto a investigation, sino 
tarnbien como complemcnto prbctico para la 
intcrvencibn. 

8 VALORACION INTELECTUAL 
DE NINOS PREESCOLARES 


Por definicibn, las pruebas de dctcccibn son 
mcnos prccisas que las evaluaciones comple- 
las, es decir, tan sdlo serial an la necesidad de 
mayor valoracibn. Como parte de cualquier 
valoracibn dc seguimiento, un profesional pue- 


dc aplicar una variedad dc instrumentos que cast 
con toda seguridad inclunan una pmeba indi¬ 
vidual de inteligencia. Aunque las punluacio- 
nes dc prueba dc los precscolares en rnedidas 
de inteligencia son notablemente inestables a 
la larga, es probable que a corto plazo no exista 
un mejor indice de la probabilidad dc que un 
nino este en riesgo de fallar en la cscuela, 
Varias pruebas dc inteligencia de aplicacibn 
individual son adccuadas para ninos prccsco- 
lares. Las de uso mas amplio son la Stanford- 
Binel: Cuarta Edition (SB:CE), la Escala dc 
Inteligencia para los Nivclcs Prccscolar y Pri- 
mario (WPPSI-R), la Baterfa de Evaluacibn dc 
Kaufman para Ninos (K-ABC) y las Differential 
Ability Scales, DAS (Escalas dc Capacidad 
Diferencial). Estos instrumentos sc revisaronen 
un tema anterior. 

B EVALUACION 

DE DISCAPACIDADES 
m PARA EL APRENDIZAJE 
] Y TRASTORNOS RELACIONADOS 

El campo de las discapacidades para cl apren¬ 
dizaje (DA) es una dc las ireas de crecimiento 
mas rdpido dentro de la evaluacibn; paradoji- 
camente, tarnbien es uno de los campos mis 
poldmicos y complejos de las pruebas psicolb- 
gicas. Se requiem de antecedentcs considerables 
para comprcndcr la funcibn de las pruebas psi- 
colbgicas en la valoracibn de las discapaci- 
dades para el aprendizaje. Se comcnzari con 
una prcgunta aparentemente sencilla que resulta 
tencr una respuesta complicada: ^qub es una 
discapacidnd para el aprendizaje? 

DEFINICION FEDERAL 
DE LAS DISCAPACIDADES 
FARA a APRENDIZAJE 

Durante decenios, la naturaleza esencial de las 
discapacidades sc ha comprendido en tbrminos 
de la definicibn incluida en la ley federal. En 
1975, el Congreso de Estados Unidos aprobb 
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la Ley Publics 94-142, cl Decreto dc Educa- 
ci6n para todos los Ninos con Discapacidad. 
Una dc las medidas dc cste decrcto era la si- 
guienic definicidn de las discapacidades para 
cl aprendizaje: 

B lermino 'discapacidad especffica para el apren- 
dizaje" signllica un iraslorno en uno o mbs de los 
procesos psicoibgicos bastcos impllcados en la 
comprensibn o utillzaclbn del lenguaje, hablado 
o escrilo. que se puedo manlfeslar en una ca- 
pacidad imperfecta para escuchar, hablar, leer, 
escribir, deletrear o llevar a cabo cblculos mate- 
malicos. El lermino incluye padocimientos como 
impedlmentos percepluales, lesibn cerebral, 
disfuncion cerebral minima, dislexia y afasia del 
desarrollo. El tbrmino no incluye a nibos que tie- 
nen discapacidades para el aprendizaje que 
son principalmente resullado de Impedlmentos 
visuales, auditivos o motores; retraso mental, tras- 
lorno emotional, o desventajas ambientales, cul- 
lurales o econbmicas (USDE, 1977, p. 65083). 

El compromiso con una deftnicidn dccretada 
por cl Estado sc confirmd cn 1990 con la apro- 
bacidn dc la Ley Publica 101-476, cl Decrcto 
dc Educacidn para Individuos con Discapaci- 
dadcs (IDEA). Un poco mis de la milad de 
losestados cn EUA siguen ahora cste modelo. Los 
estados restantes dccrctan enfoques similares 
(Lcmcr, 1993). 

La deftnicidn federal que se incorpord en 
el IDEA tambiAn estipula un enfoque opera¬ 
tional para la idcnlificacidn de ninos con 
discapacidades para cl aprendizaje. En tArminos 
cspcciTtcos, los candidates para un diagndstico 
dc DA deben demostrar una discrepancia gra¬ 
ve enlre su capacidad general (intcligcncia) y 
cl aprovechamiento espeeffteo en una o mds dc 
estas side areas: 

Expresidn oral. 

Comprensibn auditiva. 

Expresibn escrita. 

Habilidad bAsica para la lectura. 

Comprensibn dc lectura. 

CAIculo matemAtico. 

Razonamiento matematico. 

Bl modelo de discrepancia para la idcntifica- 
ci6n de ninos con DA ha funcionado como un 


indicador para los psicblogos escolarcs. En efec- 
to, cl modelo decrcla que los psicblogos deben 
aplicar una prueba individual dc intcligencia 
(medida de capacidad general) y una dc rendi- 
miento (medida de rendimiento espeeffteo) y 
despuds buscar una discrepancia entre el Cl 
Total y una o mAs dc las Areas dc rendimiento 
escolar (p. ej., lectura, matcmAticas, expresibn 
escrita). 

En tdrminos practicos, la discrepancia gra¬ 
ve sc ha deftnido como una difcrencia dc una 
desviacibn cstAndar o mils entre la intcligcncia 
general y el rendimiento espeeffteo. Una prActi- 
ca comun en la idcntificacibn de nidos con DA 
consiste en compararel Cl Total en una prueba 
individual dc inteligcncia como el WISC-III con 
las califtcaciones dc rendimiento espeeffteo en 
una prueba individual de rendimiento como el 
WIAT (Wechsler Individual Achievement Test) 
o un instrumento similar que tenga subpruebas 
cuyas normas tengan una media de 100 y des- 
viacion estandar de IS. Una diferencia de 15 
puntos o mas entre el Cl Total y el rendimiento 
espeeffteo en cualesquiera de las Areas antes 
mcncionadas darfa lugar a la sospecha de una 
discapacidad para el aprendizaje. 

Por dcsgracia, la definickSn federal no ha 
cumplido con los propdsitos dcseados y cada 
vez es mas frccuentc que los psicdlogos esco- 
lares y otros profesionales se acojan a otros 
enfoques para comprender y evaluar las disca- 
pacidadcs para cl aprendizaje cn los ninos. El 
problcma fundamental es que muchos, pero mu- 
chos ninos que exhiben graves problemas de 
aprendizaje en la escuela y se beneftciarfan 
de los scrvicios dirigidos a la DA, no salisfacen 
los criterios psicomAtricos dc una discrepancia 
grave. Esto es debido a que una discapacidad 
para el aprendizaje puede afectar de manera 
adversa el desempeho tanto en la prueba de 
intcligcncia como cn las medidas dc rendimien¬ 
to que sc utilizan para diagnosticar el trastomo, lo 
cual da por resultado un perftl de prueba que 
no cncaja con cl modelo dc discrepancia pero 
que, no obstante, representa una DA (Shaw, 
Cullen, McGuire y Brinckerhoff, 1995). Otro 
problema es que cada estado ha adoplado dife- 
rentes fdrmulas de discrepancia, de modo que 
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el diagnbstico de un nino puedc ser de DA cn 
un lugar, pero no en otro. Esto no s6lo crea con- 
fusibn, sino que socava la integridad de toda la 
empresa de identificacibn de las DA. 

SURGIMIENTO DEL CONSENSO: 

UNA NUEVA DEFINICION 
DE DISCAPACIDADES 
PARA EL APRENDIZAJE 

Despuds de un largo pcriodo de confusibn y 
lucha accrca dc la dcfinicibn dc las discapaci- 
dadcs para el aprendizaje. los especialistas y 
educadores comenzaron a coincidir alrcdcdor 
de una perspectiva consensual a inicios del de- 
ccnio de 1990. El National Joint Committee on 
Learning Disabilities, NJCLD (Comitd Nacio- 
nal Conjunto sobre Discapacidades para el 
Aprendizaje), un grupo de representanlcs de 
ocho organizacioncs nacionalcs con un interds 
especial en las discapacidades para el aprendi¬ 
zaje, propuso una nueva definicibn. Aunquc 
similar a la definicibn federal, el nucvo enfo- 
que contiene contrastes importantes: 

Discapacidades para el aprendizaje es un tdr- 
mino general que se rellere a un grupo helerogd- 
neo de trastomos que se manHiestan a iraves de 
dificultades significatlvas para la adquisicibn y 
utilizacibn de las capacidades de atencibn 
audiliva, habla. lectura, escrltura, razonamiento 
o matembticas. Estos trastomos son intrinsecos 
del Individuo, se supone que se deben a una 
disfuncibn del sistema nervtoso central y pueden 
ocurrir a lo largo de la vtda. Pueden existir pro- 
blemas en conductas de autorreguiacibn. percep- 
cibn social e interaccibn social junto con las 
discapacidades para el aprendizaje, pero en si 
mismos no constituyen una discapacidad para el 
aprendizaje. Aunque estas pueden ocurrir junto 
con otros padecimientos incapacitates [p. ej., 
deterloro sensorial, retraso menial (RM), grave 
traslomo emocional (TE)j o con inlluenclas ex- 
trlnsecas (como dilerencias culturales, instruc- 
cibn insuficiente o inaproplada), no son el 
resultado de tales padecimientos o Influencias 
(NJCLD. 1988, p. 1). 

La nueva definicibn evita la referenda vaga a 
“procesos psicolbgicos bbsicos”, especifica que 
el trastorno cs intrfnseco del individuo, identi- 


fica la disfuncibn del sistema nervioso central 
como origen de los problemas de DA y exprc- 
sa de manera explfcita que bstos pueden pcrsis. 
tir husta la cdad adulta. 

Quizb lo mbs importante dc todo es que el 
enfoque del NJCLD abandona la dependency 
excesiva en la discrepancia entre capacidad y 
rendimiento como sello distintivo de la DA. En 
vez de cllo, el nuevo modelo especifica que la 
condicibn necesaria (pero no suficienle) para 
la DA es que el individuo (nino o adulto) exhi- 
ba una debilidad intraindividual cn una o mbs de 
las breas centrales del funcionamiento acadd- 
mico (capacidades de atencibn audiliva, habla, 
lectura. escritura, razonamiento o matcmdticas). 
Shaw et al. (1995) ilustran cbmo podrfa verse 
el modelo del NJCLD dentro de la prbclica (fi- 
gura 10-1). En este enfoque, la primera tarea 
consiste en identificar una o mbs debilidades in- 
traindividuales como breas centrales. £stas 
siempre son relativas a las fortalezas en varias 
otras breas centrales. En otras palabras, las per¬ 
sonas que tienen lento aprendizaje en todas las 
breas no satisfacen los criterios de DA. El se- 
gundo paso consiste en rastrear las dificultades 
para cl aprendizaje hasta el sistema nervioso cen¬ 
tral, las cuales pueden manifestarse como 
problemas con el procesamiento de informa- 
cibn. For ejemplo, una adulta joven con una 
grave debilidad en atencibn auditiva (como 
puedc juzgarsc por su discapacidad para apren- 
dcr con el enfoque tradicional de ensehanza por 
medio dc disertacibn) podrfa exhibir un deficit 
en una prueba de memoria verbal —lo cual con- 
firmarfa que en el centra de su discapacidad se 
encuentra un problema con el procesamiento 
de informacibn. El propbsito del tercer paso 
(examen de habilidades psicosociales y de ca¬ 
pacidades ffsicas y sensoriales) consiste en es- 
pccificar los problemas adicionalcs que pueden 
requerir de atencibn para propbsitos de planifi- 
cacibn dc un programa. Por ultimo, cn el cunr- 
to paso. el examinador descarta explicaciones 
ajenas a la DA para las dificultades de aprendi¬ 
zaje (dado que bstas obligarfan a tomar una es- 
trategia diferente para la regularizacibn). 

Hammill (1990) ha sefialado sabiamente 
que las realidades polfticas son tales que es 
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Paso 1. Discrepancy intraindividual 

0 examinador identifica una dificullad significativa on 
una o mas aroas centrales junto con fortalezas relativas 
e n varias Areas. Areas Centrales: AudlckJn, Habla. 
Lecture. Escrltura, Razonamiento, MatemAlicas, Areas 
lemAticas. 

Paso 2. Discrepancia Intrfnseca del Indivlduo 

0 examinador rastrea el origen de la discrepancia hasta 
una dislunclbn del Sistema Nervioso Central (p. ej., 
lesion cerebral) o vincula la discrepancia con problemas 
en el procesamienlo do informacibn (p. ej., memoria, 
organization o etlcleocia del aprendizaje). 

Paso 3. Conslderaciones rolaclonadas 

El examinador valora la relevancia de las habllldades 
pslcosociales, lisicas y sensortales para la dlscapacidad 
para el aprendizaje. 

Paso 4. Expllcaciones alternatives 

0 examinador descarta explicaciones alternatives; por 
ejemplo, lactores ambientales, culturaies o oconbmlcos; 
o instruccton inapropiada o inadecuada. 

Paso 5. Diagnbstico de DA 

El examinador determine que los nlrtos qua prosentan 
las caracteristicas do los pasos 1 a 4 satislacen los 
crllerlos para un diagnbstioo de DA. 


Figura 10-1. Expresibn Operacional de la Definicibn de 
Discapacldades para el Aprendizaje del NJCLD. 

Futnls: Basado en Brtnckertiofl. L, Shaw. S. y McGuire, J. (1993) 
Promoting Postsecondary Education lor Students with Learning 
Disabilities; A Handbook tor Practitioners. Austin, TX: PRO-ED 

posible quc la definicibn del NJCLD nunca 
reemplace al enfoquc decretado por cl cstado. 
Pero esto es mcnos importante quc el hccho de 
quc los padres y profesionalcs sc unan alrcdedor 
de una definicibn con propbsitos de investiga¬ 
tion y comunicacibn entre sf. En la actualidad, 
la definicibn del NJCLD ha recibido el mds 
fuertc apoyo general de los profcsionales en el 
campo de la evaluacibn. 

Aunque no se analizardn aquf los puntos de 
vista adicionales, se puede referir al lector a va- 
rios otros modclos dcstacados de las discapaci- 
dades para el aprendizaje (Special Education Today, 
1985; Lcmer, 1993; Lyon, 1994). En cste con- 
•exto, y aunque se ofrecib hace varios atlas, vale 
la pena mencionar cl sabio consejo de Famham- 
Diggory (1978). Poco despues de la aproba- 
cibn de la Ley Piiblica 94-142 cn 1977 con su 
influyente definicibn de las discapacldades para 
*1 aprendizaje, esta autora escribib: 


La pubtlcacion de esta definicibn ha equrvalido a 
orvdear una bandera roja (rente de una manada 
de toros —padres y protesionales por Igual. Lo¬ 
tos de aclarar la situacion, la definicibn insplrb 
lantos grufiidos y coces que el pofvo conceptual 
se ha elevado mbs espeso que nunca. Parte del 
problema surge del hecho de que perdemos de 
vista para qub sirve una definicibn. Las definiclo- 
nes no son la verdad, tan sblo establecen las 
condlclones bajo las cuales han de tomarso ac¬ 
etones particulars (Farnham-Diggory, 1978). 

Las acciones a las quc sc hace referenda pueden 
incluir invcstigaciones, evaluaciones diagnbs- 
ticas, intervencioncs educativas o todas. Pero 
cualquiera que sea la rcspucsta quc se ponga 
en prdctica, uno debe prolcgerse contra la pro- 
pensibn a considerar las deliniciones como ver- 
daderas o falsas; son unicamente invencioncs 
humanas que tienen mayor o mcnor utilidad. 

CARACTERISTICAS ESENCIALES 
DE LAS DISCAPACIDADES 
PARA a APRENDIZAJE 

Aunque la definicibn de las DA sigue siendo 
punto de discusibn, se pueden citar varias ca- 
ractcrfsticas de estos trastomos que son mcnos 
poldmicas. Como descubrird cl lector, las par- 
ticularidades que se analizan en las siguientes 
paginas dictan, hasta cierto grado, la naturale- 
za de las prdcticas de prueba en la evaluacibn 
de las DA. Existc un acucrdo general —con 
ocasionalcs votos en contra— sobre las siguien¬ 
tes caracteristicas de estos padccimientos: 

1. Una DA implica una discrepancia en el fun- 
cionamientocognitivo. El nirio(o adulto)con 
DA revela una debilidad relativa en un drea 
en comparacibn con fortalezas cn la mayor 
parte de las otras dreas. Segun la definicibn 
federal que se sigue dentro de muchos siste- 
mas escolares, la discrepancia existe entre 
la capacidad general (inteligencia) y cl ren- 
dimiento especffico. Antes ya se han descri- 
to algunos de los escollos de esta definicibn 
y se prefiere cl enfoquc del NJCLD, en el que 
la discrepancia no se vincula de manera rf- 
gida con una difcrcncia entre las puntuacio- 
ncs de Cl y de una prueba de rendimiento. 
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2. En la mayor parte de las dcfiniciones de DA 
se incluye una cldusula dc exclusion. Si las 
dificultades acadbmicas son principalmcnte 
el producto de otros padecimicntos discapa- 
citantcs (retraso menial, trastomo emocio- 
nal, deterioro visual o auditivo, desventajas 
cultu rales o sociales), entonces es comun 
dcscartar el diagnostico. Con frecucncia csta 
clausula se interprets dc mancra crrbnea. Una 
persona puede tener tanto una DA como otro 
tipo de trastorno (p. ej., retraso mental). 
El elemento importante es que el padcci- 
miento coexistente no sea la causa principal 
de las DA. 

3. Las DA son heterogdneas, es decir, son dife- 
rentes. La investigacibn acerca dc la identi- 
licacion de los subtipos todavfa esti en su 
infancia, pero la mayorfa de los investiga- 
dorcs expresan optimismo en que puedan 
idenlificarse subgrupos significati vos de per¬ 
sonas con DA. Pendicntc de mayor investi¬ 


gacibn y refinamiento, cn la actualidad s6lo 
se reconocen dos catcgorfas amplias de es- 
tos trastornos (Forster, 1994): 

* Dislcxia o discapacidad para cl aprendiza- 
je verbal 

• Discapacidad del hemisferio derechoo pug 
el aprendizaje no verbal 

En el cuadro 10-3 se resumen las caracte- 
rfsticas dc estas dos categorfas principals 
de DA. Estos patrones ban surgido en mu- 
chos estudios sobre ninos con DA. Porejcm- 
plo, Blackely, Crinella, Fisher, Champaigne 
y Beck (1994) dislinguicron tanto una DA 
verbal como una DA no verbal en un aniili- 
sis complejo de las calificacioncs de una 
prueba ncuropsicolbgica con 177 niftos de 9 
a 14 ahos de edad. La mucstra consists en 
129 nifios con DA (incluyendo 37 con datio 
cerebral verificado) y 48 en quienes no ha- 
bfa evidencia de DA o dano cerebral. Se 


Cuadro 10-3. Caracteristicas de dos categories amplias 
de discapacidad para el aprendizaje 


Dislexia o discapacidad para el 
aprendizaje verbal 

Discapacidad del hemisferior derecho 
o del aprendizaje no verbal 

Manifestacion principal 

Dificultad inesperada en el aprendizaje de leclu- 
ra u ortograffa 

Habilidades deficientes en malembticas, escritura 
manuscrita o cognicibn social 

Deficiencia fundamental 

Problemas en codilicacidn fonolbgica (asocia- 
cibn de sonidos con combinaciones de lelras) 

Problemas en relaciones espaciales (percepdbn 
visoespacial de relaciones) 

Correlatos fisiolbgicos 

Anomalias sutiles en el hemisferio cerebral iz- 
quierdo (revelados por rastreos cerebrates y 
estudios de EEG) 

Probable origen en una disfuncibn del hemislerio 
cerebral derecho 

Incidencia relativa 

Cerca de 90% de todos los casos de DA 

Cerca de 10% de todos los casos de DA 

Proporcibn de nino^ a ninas 

3:1 o 4:1 

1:1 


Fuente: Basado en Forster, A. (1994) Learning disabilities EnR J Sternberg (ed ), Encyclopedia oT Ituman mtetitgenco. Nuova York 
Macmillan 
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idcntificaron scis patroncs dc dcscmpefio neu- 
ropsicoldgico por medio dc un complejo 
mctodo estadfstico de racimos: 

1. Cl muy bajo: ninos con Cl muy bajo, 
pero que en otros scntidos no tenfan cali- 
ficaciones discrepantes dc prucba. 

2. Cl bajo: ninos con Cl bajo, pero que en 
otros sentidos no tenfan calificaciones dis¬ 
crepantes de prucba. 

3. Torpcs/lctargicos: ninos cuyas calificacio- 
nes de prueba indican torpeza o letargo. 

4. DLsfuncion del lenguaje: nifios con cali- 
ficacioncs rclativamcnte bajas en varia¬ 
bles del lenguaje. 

5. Disfunciort espacial: ninos con buena 
funcidn verbal pero con problcmas cn 
oricntacidn espacial. 

6. Sin deficit: ninos que no tenfan deficien- 
cias que pudieran dctectarse. 

Los grupos 4 y 5 corresponden a las princi¬ 
ples catcgorfas dc DA listadas anteriormen- 
le (DA verbal y no verbal), mientras los otros 
grupos representan a la normalidad (gru- 
po 6), la baja capacidad intclcctual (grupos 1 
y 2), o vaiiantes de posiblc DA (grupo 3). Por 
supuesto, algunos de los nifios en los grupos 
1 y 2 podrfan satisfaccr los criterios de DA 
si se les evaluara con pruebas adicionalcs. 

4. Una DA es un fendmeno del desarrollo que 
por lo general es evidente en la primera in- 
fancia y que puede persislir hasta la edad 
adulta. Aunquc los esfuerzos de rcgulariza- 
cidn deben basarse en el optimismo —a fin 
de evitar las profeefas autocumplidas— tam- 
bien es necesaria cierta dosis de realismo. 
Los estudios con nifios que sufren graves DA 
sugieren que la mejorfa notable en rendi- 
miento acaddmico es la excepci6n mis que 
la regia, incluso cuando cstos individuos re- 
ciben una intcrvcncidn cducativa intensiva. 
Porejemplo, Frauenheim y Heckerl (1983) 
volvieron a evaluar a 11 adultos a quienes 
se habfa diagnosticado con DA en su infan- 
cia. Todos los participantes habfan recibido 
ayuda especial en lectura: nueve se gradua- 
ron de la educacidn media superior y dos 


terminaron el primero dc preparatoria. Los 
Cl Totales se ubicaron por lo comun en la 
parte baja del rango de 90, con el Cl Verbal 
por debajo del promedio (media de 85) y cl 
Cl de Ejccucidn por arriba del promedio 
(media de 104). A pesar dc la intervencidn 
de regularizacidn, cuando sc les volvid a exa- 
minar en la edad adulta cxactamente con la 
misma prucba de rendimiento, la Wide Range 
Achievement Test (Prueba de Rendimiento 
dc Amplio Rango), cstos individuos habfan 
mejorado poco con respecto a sus resulta- 
dos en la escucla primaria. Estos datos se 
corroboraron en otros estudios de seguimien- 
to (para una revisidn, vdase Kolb y Whishaw, 
1990; cap. 29). Dichos resultados indican 
que los especialistas que trabajan con ni¬ 
fios que tienen DA no deben concentrarse 
unicamente en las preocupaciones acaddmi- 
cas. Los problemas sociales y emocionalcs 
—que pueden ser mis susceptibles a la in- 
tervencidn— tambidn demandan atcncidn. 

5. Con frecuencia, los individuos con discapa- 
cidad para el aprendizaje experimentan 
trastomos sociales y emocionales que son 
tan gcncralizados y trascendentales como las 
dificultades en rendimiento acaddmico. Estos 
problemas pueden persistir hasta la adoles- 
cencia y edad adulta. De hecho, las secuelas 
sociocmocionales a menudo se vuelven la 
principal afeccidn exhibida, lo cual puede 
complicar el proceso de prueba y oscureccr 
cl diagndstico. Por ejemplo, en un estudio 
sobre evaluacidn dc necesidades con 381 
adultos con DA, Hoffman, Sheldon, Minskoff 
y colaboradores (1987) identificaron varias 
ireas importantes, no acaddmicas, que me- 
reefan intervencidn por parte de los encar- 
gados de scrvicios. Estos adultos expresaban 
con gran frecuencia varios problemas socia¬ 
les y emocionales: sentimientos de frustra- 
cion (40%), hablar o actuar antes de pensar 
(33%), timidez (31%), falta de confianza en 
sf mismos (28%), control de emociones y 
caricter (28%) y salir con personas cn una 
situacidn romantica (27%). Tambidn se ex- 
presaron muchos otros problcmas, pero en 
menos de 25% de la muestra. Estos datos 
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indican quc las evaluaciones de la discapa- 
cidad para el aprendizaje deberfan incorpo- 
rar rnedidas del funcionamicnto social y 
emocional. Vaughn y Haager (1994) propor- 
cionan una excelente revision general sobre 
las habilidades sociales en personas con 
discapacidad para el aprendizaje. 

CAUSAS Y CORRELATOS 
DE LAS DISCAPAODADES 
PARA EL APRENDIZAJE 

Aproximadamente 4% de todos los nifios en 
edad escolar reciben un diagndstico de DA. de 
modo quc dste no es un problema poco frccucn- 
te (Chalfant, 1989). El tipo mds comun de DA 
es la dislexia, y los ninos superan en numero a 
las niiias en una proporcidn de cerca de 3:2 
(Nass, 1992). En una minorfa dc casos, la ctio- 
logfa es clara y puede atribuirse a una causa 
especffica como una lesidn cerebral conocida. 
El lector recordard del capftulo 9 que cl dete- 
rioro en el hemisferio izquierdo tienc especial 
probabilidad de resultar en dificultades verbales. 
mientras que el dano en el hemisferio derecho 
puede conducir a problcmas con el pensamiento 
espacial y otras habilidades no verbales. Asf, la 
lesidn cerebral u otros problcmas ncuroldgicos 
pueden ser la causa inmediata de quc un niflo 
rcciba un diagndstico de DA. 

No obstante, en la mayor parte de los ca¬ 
sos, la etiologfa directa de estos problemas es 
poco clara. Se han propuesto varias posibilida- 
des quc pueden explicar s6lo algunos de ellos. 
Por ejemplo, se han identificado procesos pa- 
tologicos del desarrollo ncuroldgico en algunas 
personas con dislexia grave (Culbertson y 
Edmonds, 1996). Los individuos con este tras- 
tomo parcccn tener altcracioncs en estructuras 
cerebrales como cl piano temporal (la superfi- 
cic plana en la parte superior de los Idbulos tem- 
porales), del cual se sabc quc es importante para 
el procesamiento del lenguaje. Mientras que en 
los individuos normales el piano temporal es 
mucho mds grande en el Idbulo temporal iz¬ 
quierdo que en el derecho, las personas con 
dislexia grave no muestran este patrdn de asi- 


metrfa (mds bien una tendencia a la simetrfa) 
Lo que es mils, los investigadores han identifi- 
cado malformaciones corticales microsc6pica s 
llamadas polimicrogiria (numerosas circun- 
voluciones pequefias) andlogas a cstas diferen- 
cias estructuralcs. Varios cstudios post mortem 
de personas con dislexia grave han rcvelado es- 
tas dcsviacioncs a ni vel celular. La dislexia tarn- 
bidn parecc mostrar un importante componcnte 
gendtico en el caso de algunas personas, de mo- 
do que necesita tomarse en serio la idea dc 
dislexia familiar. Sin embargo, es necesario cn- 
fatizar que para la mayorfa de los individuos, la 
etiologfa de la DA (ya sea dislexia u otras for 
mas) atin es un misterio. 

EVALUACION DE LAS DISCAPAODADES 
PARA EL APRENDIZAJE 

Las discapacidades para el aprendizaje se ma- 
nifiestan principalmente como problemas aca- 
ddmicos; es decir, es comun que un nifio con 
DA no pueda dominar las habilidades impor- 
tantes para el dxito escolar como la lectura, 
matemdticas o comunicacion escrita. Debido a 
que los logros en la escuela estdn en el centra 
del problema, una valoraci6n de la DA debe 
incluir rnedidas rclacionadas con cl rcndimien- 
to academico. Ademds, esta valoracidn —una 
pequeha parte de la evaluacidn de una DA— 
debe basarsc en una prueba individual dc ren- 
dimiento. Aunque una prueba grupal de rendi- 
miento podrfa hacer surgir la sospecha de una 
DA, los profesionales deben depender de las 
pruebas individuates para la evaluaci6n dcfini- 
tiva. A continuacidn se explican las razones para 
esto y despuds se revisan los instrumentos uti¬ 
les para la evaluacidn del rendimiento. 

Por lo comun, las pruebas individuates de 
rendimiento se aplican en una situacidn (rente 
a frente, donde el examinador sc sicnla dc cara a 
la persona evaluada y le plantea preguntas y 
problemas. Por supucsto, cualquier prueba bien 
estandanzada del rendimiento producird datos 
normativos acerca del funcionamiento de un 
escolar, pero la virtud especial de estas prue¬ 
bas es que el examinador puede observar los 


I 
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dctallcs clfnicos del dcscmpcno deficiente (o 
superior) y formar hipdtesis accrca dc las ca- 
pacidades cognitivas de la persona exarmnada. 

Considdrcsc cl problema de la ortografTa 
deficiente. quc se obscrva mucho en ninos y 
adultos con DA verbal. Cualquier prueba bue- 
n a de rendimiento en ortograffa documentara 
|a discapacidad; no obstante, se obtiene poco 
discemimienlo a partir de las mcras calificacio- 
nes. Lo que el examinador debe tratar de cono- 
c eres la naturalcza cualitativa del problema, no 
sdlo sus dimcnsiones cuantitativas. Las prue- 
bas individuales de rendimiento son inaprecia- 
blcs en ese sentido. Mediante la observacidn de 
|os detallcs del dcscmpcno deficiente, un exa- 
minador hibil puede formular hipdtesis accrca 
del origen de un problema de rendimiento. Por 
ejemplo, un nifio cuya ortograffa es fond- 
licamente correcta, al menos esti escuchando 
las palabras de manera adecuada, mientras que 
uno con ortograffa fondtica incorrecta bien po- 
drfa rcvelar un problema con el proccsamiento 
auditivo de los sonidos del lenguaje. 

PRUEBAS INDIVIDUALES 
DE RENDIMIENTO 

Existc mis de una docena de pruebas de rendi¬ 
miento dc aplicacidn individual, pero sdlo pocas 
se utilizan de manera general en la evaluacidn 
de las DA. Las pruebas individuales de rendi¬ 
miento mis importantes incluycn Diagnostic 
Achievement Batery Second Edition. DAB-2 
(Baterfa de Diagndstico del Rendimiento-2); 
Kaufman Test of Educational Achievement, 
K-TEA (Prueba Kaufman de Rendimiento Edu- 
cativo); Mini-Battery of Achievement, MBA 
(Minibaterfa de Rendimiento); Peabody Indi¬ 
vidual Achievement Test -Revised, PIAT-R 
(Prueba Peabody dc Ejccucidn Individual -Revi- 
sada); Wechsler Individual Achievement Test, 
WlAT (Prueba Wechsler de Rendimiento Indi¬ 
vidual) y Baterfa Psicoeducativa Woodcock- 
Johnson -Revisada (WJ-R), y la Wide Range 
Achievement Test, WRAT-III (Prueba de Ren¬ 
dimiento de Amplio Rango-Ill). Las caracte- 
dsticas csenciales de estas pruebas se resumen 


en el cuadro 10-4. Dcbido a las limitaciones de 
espacio, sc sclcccionari una prueba, la K-TEA, 
para una presentacion mis detailada. Se sugie- 
re a los lectores que deseen mayor informacidn 
sobre estas pruebas que consulten a Saltier (1988, 
cap. 13) y la serie del Mental Measurements 
Yearbook (Conoley e lmpara, 1995; Conolcy y 
Kramer, 1989, 1992; Mitchell, 1985). 


KAUFMAN TEST OF EDUCATIONAL 
ACHIEVEMENT 

La K-TEA es una prueba sin Ifmite dc tiempo 
del rendimiento educativo para ninos entre 6 y 
18 anos de edad. Existe una versidn breve con 
tres subpruebas, pero cuando se trata de una 
evaluacidn diagndstica de las DA se prefierc la 
Forma Amplia. Esta incluye cinco subpruebas: 
Decodificacidn de Lectura, Comprensidn de 
Lectura, Aplicaciones Matemiticas, Cilculos 
Matemiticos y Ortograffa. El tiempo de la prue¬ 
ba es dc aproximadamente una hora para los 
nifios dc mayor edad, y un poco menos para 
aquellos mis pequefios. 

En el cuadro 10-5 se muestran ejemplos 
breves dc rcactivos similares a los de la K-TEA. 
festos se encontrarfan en el extremo supe¬ 
rior de las subpruebas y serfan apropiados para 
estudiantes de educacidn media superior. La 
K-TEA utiliza rcglas dc inicio y terminacidn para 
cada subprueba, a fin de asegurar quc los estu¬ 
diantes sdlo tengan que responder a reactivos 
dc dificultad apropiada. La calificacidn es com- 
plctamcntc objetiva: 1 para los rcactivos correc- 
tos y 0 para los incorrcctos. Las puntuaciones 
en bruto se convierten en puntuaciones cstin- 
dar (media dc 100, DE dc 15) para cada sub¬ 
prueba, para la puntuacidn compuesta de 
lectura, puntuacidn compuesta de matemiticas 
y para la puntuacidn compuesta dc la baterfa 
compleia. 

Ademis dc la calificacidn formal, la K-TEA 
proporciona un mdtodo sistemitico para eva- 
luar la naturaleza cualitativa de los errorcs dc 
subprueba. Por ejemplo, en la subprueba de Or¬ 
tograffa, los errorcs pueden clasificarse si 
implican prefijos, sufijos, dfgrafos de vocal 
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Cuadro 10-4. Revisibn de pruebas individuates de rendimlento de mas uso 


Diagnostic Achievement Battery-2, DAB-2 
(Bateria de diagndstico de rendimiento) 

Newcomer (1990) 

Adecuada para edades de 6 a 14 anos, la DAB-2 
consiste en 12 subpruebas que se omplean para 
calcular ocho punluaclones compuestas mixtas. 
Las punluaclones compuestas incluyen Audicion, 
Habla, Leclura, Escritura, MatomAticas, Lenguaje 
hablado, Lenguaje escrilo y Total de Aprovecha- 
miento. MAs amplia que la mayor parte de las 
pruebas de rendimiento, la DAB-2 requiere hasta 
dos horas para su aplicacidn. Las normas de la 
prueba se establecieron cuidadosamente con 
2 600 ninos a nivel nacional. 

Kaufman Test of Educational Achievement, 
K-TEA (Prueba Kaufman de Rendimiento 
Educativo) 

Kaufman y Kaufman (1985) 

La K-TEA es una prueba individual de rendimiento 
con normas adecuadas, una de cuyas caracteris- 
ticas especiales es el detallado analisis de errores 
(vAase texto). En la aclualidad, las normas se ex- 
tienden sdlo hasta las edades de bachillerato. Una 
lorma breve, independiente, que puede aplicarse 
en 30 minutos o menos, es util para propAsitos de 
detecciAn. 

Mini-Battery of Achievement, 

MBA (Minibateria de Rendimiento) 

Woodcock, McGrew y Werder (1994) 

Evaliia cuatro amplias Areas de rendimiento —lec- 
tura, escritura. matemAticas y conocimientos ob- 
jelivos— para personas de 4 a 90 anos de edad o 
mAs. La bateria completa puede aplicarse en 30 
minutos. La MBA proporciona una cobertura mAs 
general de las habilidades bAsicas y aplicadas que 
ninguna olra bateria breve. For ejemplo, el com- 
ponente de leclura evalua identilicacidn de letra- 
palabra, vocabulario y comprensidn. 

Peabody Individual Achievement Test -Revised, 
PIAT-R (Prueba Peabody de Ejecucidn Individual 
-Revisada) 

Markwardt (1989) 

Para edades de 5 a 18 aiios, esta prueba de 60 
minutos incluye subpruebas de informacidn gene¬ 
ral, reconocimiento de lectura, comprensidn de lec- 
tura, matemAticas y orlografla. En la actualidad se 
ofroce una nueva subprueba, expresidn escrita, 
para detectar habilidades de lenguaje escrito. Su 


aplicacidn requiere de entrenamiento mlnirno; i* 
pueden aplicar maestros con entrenamietUn 
apropiado. 

Wechsler Individual Achievement Test, WlAT 
(Prueba Wechsler de Rendimiento Individual) 
Wechsler (1992) 

La Prueba Wechsler de Rendimiento Individual 
consiste en ocho subpruebas: lectura bAsica, 
razonamienlo matemAtico, orlografla, compren¬ 
sidn de lectura, operaciones numdricas, expresidn 
oral, comprensidn auditiva y expresidn escrita. 
Adecuada para edades de 5 a 19 ados, las nor¬ 
mas de la WlAT se obtuvieron junto con las del 
WISC-lll. La aplicacidn a personas mayores pue¬ 
de requerir hasta 75 minutos. Una versidn mAs 
corta, el Detector WlAT (lectura bAsica, razona- 
miento matemAtico, ortografla) puede aplicarse 
en 10 a 15 minutos. 

Woodcock-Johnson -Revisada, WJ-R 
Woodcock y Johnson (1989) 

La Woodcock-Johnson -Revisada cubre a indrvi- 
duos desde los dos ados de edad hasta la edad 
adulta. La bateria completa comprende Ires Areas 
de luncionamiento: rendimiento, capacidad cognl- 
tiva e intereses. Las nueve pruebas estAndar de 
rendimiento producen punluaclones agrupadas en 
Areas denominadas Lectura Amplia, MalemAtl- 
cas Amplias, Lenguaje Escrito Amplio, Conocl- 
miento Amplio y Habilidades. Las pruebas de 
rendimiento son sumamente respetadas, pero 
algunos crfticos recomiendan toner precauclAn en 
el uso de la bateria cognitive. 

Wide Range Achievement Test, WRAT-III 
(Prueba de Rendimiento de Amplio Rango-lll) 
Wilkinson (1993) 

La WRAT-III tiene normas adecuadas para edades 
desde los 5 hasta los 75 afios y se le utiliza de 
manera amplia como instrumento de detecciAn 
Las subpruebas incluyen lectura, ortogralla y 
aritmAtica. La principal debilidad de la bateria os 
la subprueba de lectura, la cual en realidad s4k> 
es una medida del reconocimiento de palabras. 
Dicha subprueba consiste en pedirle a la persona 
examinada que prenuncie en voz alia cada pala- 
bra de una iista que va desde palabras sencillas 
hasta diflciles. Debido al limitado contenido de los 
reactivos y a las alias correlaciones entre subprue* 
bas, la WRAT-III es inadecuada para la Identifies* 
ci6n de deficiencias en habilidades especfficas. 
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Cuadro 10-5. Ejemplos de reactivos 
caracteristicos de la K-TEA 
apllcables a nirios mayores 

Qecodiflcacion de lectura 
£1 examinador senala cada palabra a la vez y 
dice: “iqub palabra es bsta?" 
dodecbgono vociferante correlativo 
indolencia perspicacia 

Comprension de lectura 

El examinador dice: “Haz lo que esto dice". 
Expresn una respuesta falsa para la pregunta: 
“icubntos ojos tiene un cfclope?" 

Ortografia 

El examinador explica las reglas para un texto 
Iradicional de ortografia, concluyendo con: 
“Qutero que escribas la palabra en esta hoja". 
"Bienquerida. Una persona amada es 
Bienquerida" 

Cilculo matembtico 

El examinador dice: “Ahora quiero que resuelvas 
eslos problemas”. 

(X- 7) (X- 9) = 5 Kg 5gr 

-2 Kg 14 gr 

Aplicaciones matemdticas 

El examinador dice: "Los Diablos de Durango 
jugaron 80 paitidos el ano pasado. Ganaron 16 
juegos. ^Qu6 porcentaje de juegos ganaron?" 


(p. cj., uc en blue*) y diptongos, agrupacioncs 
de consonantcs (como scr en inescrupuloso), 
patrones controlados por r (como er en infe- 
nor) y otros patrones. 

Kaufman y Kaufman (1985) dcstacan que 
el andlisis de los errores le proportions al pro- 
fesional del diagndstico una fuente de informa- 
cidn a partir de la cual pueden elaborarse los 
objelivos educativos. Por cjemplo, una debili- 
dad en dfgrafos y diptongos dc vocal en la 
subprueba dc Ortografia se traduce de manera 
directa en objeli vos para el saldn de clase: prdc- 

' Nota del Traductor. En cspanol sc considcra que las 
letras II y ch son dlgrafos. Sin embargo, no existen en 
realidad dlgrafos dc vocal como ocurre en otros idio- 
nias (como en el francos ou —por cjemplo, “gour¬ 
met”). 


tica dc ortografia y lectura dc cstos elementos 
cn aislamiento, progresidn a ortografia y pro- 
nunciacidn de palabras que contengan dlgrafos 
y diptongos y terminacion con escritura y lec¬ 
tura de oraciones que contengan palabras con 
dfgrafos y diptongos. El Manual de la K-TEA 
contiene muchos discemimientos clfnicos titi- 
les que ticnen ramificaciones educativas. 

Aunque las muestras normativas de la K-TEA 
y la descripcidn de sus caractensticas son un 
modelo de excelencia, las caracterfsticas tecni- 
cas de este instmmento varfan cn cuanto a suft- 
ciencia. Las conftabilidades por mitades pant 
las cinco subpruebas van de .87 a .96, que son 
valores bastantc aceptables para una prueba de 
rendimiento. Los datos de cstabilidad son menos 
claros. Los datos para 172 estudiantes a los que 
se volvid a evaluar a los 35 dfas se dcsplomaron 
en cl caso dc los grados 1 a 6 y secundaria a ba- 
chillerato. Todas las corrclaciones dc subprue¬ 
bas y compucstos superaron al .90, pero es 
probable que estos valores estdn inflados debido 
a que mezclan la estabilidad del rendimiento con 
las corrclaciones de grado contra rendimiento. 

La validez de contenido de la K-TEA pa- 
recc scr muy fuertc, pero este aspecto puede 
variar dc un sistema escolar a otro. Despuds de 
todo, cada sistema escolar puede optar por cn- 
falizar diferentes Ureas de rendimiento. Salvia 
e Ysseldikc (1991) advierten que los usuarios 
deben ser sensibles a la correspondence entre 
el contenido de la K-TEA y el currfculo de los 
estudiantes. Como ocurre con cualquier prue¬ 
ba dc este tipo, el usuario deberfa veriftcar que 
cl contenido dc la K-TEA sea apropiado den- 
tro del entorno acaddmico. No obstante, 
Kaufman y Kaufman (1985) ofrecen suficiente 
cvidencia dc la validez de la prueba como para 
defender su idoneidad general. 

BATERtAS DE PRUEBA 
EN LA EVALUAa6N DE LA 
DISCAPACIDAD PARA EL APRENCHZAJE 

Aunque los expertos concuerdan cn que la eva- 
luacidn de una posible DA requiere de un en- 
foque multifacdtico, existe poco consenso cn 
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cuanto a cuales son los mejores instrumentos y 
(ccnicas. Por supuesto, las hcrramicntas csen- 
ciales en la evaluacidn dc niftos con esta 
discapacidad son las mcdidas confiables y vA- 
lidas dc inteligcncia y rendimicnto. Cast todas 
las batcrfas para DA incluyen instrumentos con- 
vencionalcs cn ambas Areas; por ejemplo, la 
SB:CE, WPPSI-R o WISC-III para la evalua- 
ci6n intelectual y la PIAT-R, K-TEA, WJ-R o 
WIAT para la medicidn del rendimiento. Sin 
embargo, la eleccidn de medidas auxiliares para 
evaluar habilidades del lenguaje, formas cspc- 
ciftcas de procesamiento de informacidn o pro- 
cesamiento visoperceptual diferirAn dc un 
profcsional a otro. Lo quc cs mAs, muchos exa- 
minadorcS individualizarAn la baterfa de prue- 
ba en funcidn de las preguntas de canalizacidn. 
En el ejemplo dc caso 10-1 se proporciona una 
baterfa representative de prueba para la evalua- 
cidn de DA de Jaime, un nifio de nueve <mos 
con antcccdentes de fracaso en la escuela. 


PI evaluaci6n del trastorno 

POR DEFICIT DE ATENCI6N 
vjCON HIPERACT1V1DAD (TDAH) 


Estc trastorno es el tArmino propucsto por la 
American Psychiatric Association para nombrar 
un sfndrome conductual conocido anterior- 
mente como trastorno por deficit de atencidn 
con hiperactividad, disfuncidn cerebral mini¬ 
ma e hiperquincsia (American Psychiatric 
Association, 1994). Es frecucntc quc los nifios 
con este trastorno exhiban un rendimiento aca- 
dAmico bajo. Por tanto, a menudo se les canali¬ 
ze para una evaluacidn dc DA. No obstante, 
aunque a menudo la DA y el TDAH coexistcn 
y sus sfntomas se superponen ligeramente, son 
sfndromes distintos a un nivel conceptual. En 
nuestro caso, sc revisarAn ciertos instrumentos 
tidies disenados para ayudar a diagnosticar el 
sfndrome dc TDAH. 

El TDAH se presenta en ires variedades: 
prcdominancia de problemas de atencidn, pre¬ 
dominance de hiperactividad-impulsividad y 
tipo combinado. El primero sc define por la pre¬ 


sence de seis o mAs sfntomas de distraccUfo 
pero menos de seis sfntomas de hiperactividad! 
impulsividad. El tipo hiperactivo-impulsivo se 
define por la presencia de seis o mAs sfnto- 
mas dc hiperactividad-impulsividad, pero 
menos de seis sfntomas dc distraccidn. El tipo 
combinado consiste en seis o mAs sfntomas de 
ambos grupos. En todos los casos, los sfnto- 
mas deben cstar presentes al menos durante 
seis meses, y deben conducir a un deterioro del 
funcionamiento social, acadAmico o laboral. Los 
sfntomas diagndsticos del TDAH se resumen 
en cl cuadro 10-6. 

Cuadro 10-6. Sfntomas diagnostics 
del Trastorno por Deficit de 
Atencidn con Hiperactividad 

Tipo con problemas de atencidn 
(seis o mas sfntomas) 

Falla de atencidn a los detalles 

Dificultad para mantener la atencidn 

No parece escuchar 

Fracaso en la consecucidn de una tarea 

Dificultad para organizar tareas 

Evita el esfuerzo mental sostenido 

Pierde las cosas 

Se distrae con facilidad 

Olvidadizo en actividades cotidianas 

Tipo hiperactivo-impulsivo 
(seis o mAs sfntomas) 

Inquietud, movimlentos constanles o ambos 
Abandons su asiento en clase 
Cone o se sube en objetos de manera inaproplada 
Dificultad para jugar tranqullamente 
Parece vehemente. siempre en movimiento 
Habla mucho 

Responde de manera abrupta 

Dificultad para esperar su turno 

Interrumpe a los demAs o se enlromete con ellos 

Tipo combinado 

Seis o mAs de los sfntomas en cada una de las 
Areas anteriores 

Fuente: Basado en la American Psychiatric Association (1994) 
Diagnostic and statistical manual ot mortal disorders (4a ed) 
Washington, D, C: Autor 
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Ejemplo DE CASO10-1 

UNA BATERIA DE PRUEBA EN LA EWLUAC36N DE LA DISCAPAdDAD PARA EL APRENDtZAJE 

Jaime es un nino de nueve anos de edad canalizado por su pediatra para valoracibn de una 
posible discapacidad para el aprendizaje. Sus padres y maestros caracterizaron a Jaime como 
un nino distrafdo, tranquilo y encantador, pero flojo en cuanto a su trabajo escolar, on particular 
on relacibn con las (areas escritas. Con frecuencla parecfa que no prestaba atencibn a lo que el 
maestro deda. El propbsito de la evaluacibn era determinar si en el caso de Jaime se podia 
dlagnosticar una DA y tambibn ofrecer recomendaciones para regularizacibn. 

El examinador utilizb inslrumentos estbndar como el WISC-III y la Baleria Psicoeducativa 
Woodcock-Johnson -Revisada (WJ-R), pero tambibn los complementb con medidas disenadas 
para las preocupaciones especfficas de la canallzaclbn (p. oj., problemas con distraccibn y 
comprensibn audiliva). Lo que revelb la batorfa de pruebas fue una Imagen de capacidad intelectual 
adecuada en Ibrminos generates (Cl Total del WISC-III de 100), con relativa debilidad en Areas 
verbales (p. ej., fndice de Comprensibn Verbal de 89) y capacidad relativa en Areas no verbales 
como organizacibn perceptual, memoria visual e Inlegracibn visomotora (p. ej., fndice de 
Organizacibn Perceptual de 110). No obstante, a pesar de estas Areas de competencia, Jaime 
luncionaba a un nivel mucbo menor en, cuando menos, un Area acadbmica (Muestras de escritura 
en el percentil 5). Estos datos corroboraron con toda seguridad las impresiones del maestro y 
de los padres. A nivel descriptivo, estos resultados sugirieron fuertemente un diagnbstico de 
discapacidad para el aprendizaje verbal, en especial, dado que podfan descartarse otros 
(adores conlribuyentes (p. ej., Irastomo omocional, inslruccibn deficlente). 

No hay duda de que la fuente de sus dificultades tenia algo que ver con sus capacidades 
sumamente deficientes en cuanto a comprensibn auditiva. Jaime tenia un desempeno en el 
porcentaje mAs bajo para nihos de su edad en la Test lor Auditory Comprehension of Language 
-Revised, TACL-R (Prueba de Comprensibn Auditiva del Lenguaje) y en la Wepman Auditory 
Discrimination Test (Prueba Wepman de Discriminaclbn Auditiva). En la TACL-R, el examinando 
escucha una palabra u oracibn y despubs sefiala al dibujo en bianco y negro (de un grupo de 
tres) que mejor representa el signlficado. En la Prueba Wepman de Discriminaclbn Auditiva, el 
examinador lee un par de palabras similares y el niflo indica si son Iguales o difereptes. Las 
dificultades en ambas pruebas representaron una fuerte indicacibn de que Jaime exhibla un 
dbficit fundamental en el procesamienlo y comprensibn de palabras habladas. Este dbficit ayudb 
a explicar su problems con la expreslbn escrita (Rango percentil de 5 en Muestras de escritura). 
Sin duda, sus dificultades de atencibn tambibn contribulan al ctimulo de problemas que 
experimentaba. 

Una conclusibn importante que surgib de los resultados de prueba fue que Jaime podrfa 
aprender mejor a partir de instrucciones escritas que habladas. Despubs de todo, luvo 
punluaciones exactas en el rango promedio para habilidades de lectura (Comprensibn de textos 
de 100). Otra Implicacibn de los datos era que aunque mostraba ciertas dilicultades de atencibn, 
bslas no eran tan graves como para demandar una valoracibn posterior. El principal centra de 
atencibn de la intervenclbn consistib en moderar su dificultad muy significative en comprensibn 
auditiva. 
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Ejemplo OE CASO10-1 

UNA BATERIA DE PRUEBA EN LA EVALUAG^N DE LA DISCAAAGQAD PARA EL APRENDIZAJE 
(continuod6n) 


Rosumen do los resultados do prueba do Jalmo 


Equivalente en 

Puntuacidn Escalar 

Percentil 

0 10 30 50 70 

90 100 

Habilidades verbales 

fndice de comprensidn verbal 

89 

1 

24 

Prueba de hallazgo de palabras 

88 

1 

22 

Habilidades de organizacidn 
perceptual 

fndice de organizaclOn perceptual 
del WISC-III 

110 

1 

74 

Prueba de inteligencia no verbal-3 

109 

1 

72 

Integracldn visomotora 

Test Guestdltico Visomolor de Bender 

120 


1 91 

Prueba del desarrollo de la IVM 
(Inlegracion visomotora) 

107 

1 

68 

Comprensidn auditiva 

TACL-R (Comprension auditiva) 

72 

1 

3 

Prueba Wepman de DiscriminaciOn 
Auditiva 

65 

1 

1 

Memoria 

fndice de memoria verbal do la WRAML 

82 

1 

12 

fndice de memoria visual de la WEAML 

99 

1 

48 

Habilidades de atencidn 

fndice de dislractibilidad del WISC-III 

84 

1 

15 

Tarea de vigilancia (Sistema Gordon) 

82 

1 

12 

Tarea de distractibilidad (Sistema 
Gordon) 

80 

1 

9 

Rendimiento acoddmico 

Compronsidn de Textos de la WJ-R 

100 

1 

50 

Muoslras de escritura de la WJ-R 

75 

1 

5 

Cdlculo de la WJ-R 

95 

1 

37 

Problemas aplicados de la WJ-R 
(Matem&ticas) 

110 

1 

74 
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Por dcsgracia, estos criterios oficialcs son 
v2 gos al grado quc llcvan al desalicnlo y relati- 
yjmenic comuncs incluso cn ninos normales. No 
essorprcndente que los estimados de hipcracti- 
vjdad abarquen de 3 a 20% de la poblacidn en 
jdad escolar (Canlwell, 1975). Para complicar 
lotlavia mas las cosas, los expcrtos en cste 
caI npo cnfatizan olros elcmcntos cn la imagen 
general del TDAH. Por ejemplo, Barkley (1981) 
seriala que los nifios con TDAH muestran defi- 
ciencias principalmentc en situaciones donde 
las insirucciones rcquicrcn respuesta demora- 
ja, sostenida o ambas, de acuerdo con siste- 
inas de reglas bien definidos. Tambidn enfatizu 
que estos ninos ticncn un desempefio deficien- 
te cuando se demoran los reforzamientos. Asf, 
en el ambiente comun dc prueba donde se dan 
areas interesantes con recompcnsas inmedia- 
las, un nifio con TDAH puede parecer bastante 
normal. El examinador que sospecha quc un 
nifio exhibc TDAH enfrenta un reto diagndsti- 
co abrumador. Por fortuna, varios sistemas 
confiablcs y validos de calificacidn pueden ayu- 
dar cn la elaboracidn del diagndstico. 

Conners (1990, 1991) ha producido una 
familia de esealas dc calificacidn utiles para 
idcntificar la hipcractividad y olros problcmas 
conductualcs cn ninos. Las Conners’ Teacher 
Rating Scales, CTRS (Esealas Conners dc clasi- 
ftcacidn del Maestro), sc pueden obtener cn dos 
formas, una quc conlicne 28 reactivos (ClKS-28) 
y otra con 39 (CTRS-39). El maestro califica al 
niho en cada uno de los reactivos en una escala 
decuatro puntos. Las dos formas producen pun- 
tuaciones escalates diferentes y poseen propie- 
dades psicomdtricas diversus. Las normas de la 
CTRS-28 se esiablecieron con 383 ninos dc 3 
a 17 afios de edad y produce tres esealas: Pro¬ 
blems Conductual, Pasividad con Distraccidn 
e Hipcractividad. Las normas dc la CTRS-39 
seobtuvieron con 9 583 ninos de 4 a los 12 afios 
deedad y produce scis esealas: Hiperactividad, 
Indulgences Emocional Extrema, Conducta 
Asocial, Problema Conductual, Ansiedad-Pasi- 
vidad y Problema dc Atencidn-Fantasias. 

Las Conners’ Parent Rating Scales, CPRS 
(Esealas Conners dc Clasiftcacidn de Padres) 
tombidn pueden obtenerse en dos formas, una 


quc contiene 48 reactivos (CPRS-48) y otra con 
93 (CPRS-93). Las normas de la CPRS-48 se 
aplicaron a ninos de 6 a 14 ados de edad y pro¬ 
duce cinco esealas: Problemas Conductuales, 
Smtomas PsicosomAlicos, Ansicdad, Problcmas 
dc Aprcndizaje c Impulsividad-Hiperactividad. 
La CPRS-93, cuyas normas sc aplicaron a ni¬ 
fios entre 3 y 17 afios dc edad, incluye ocho 
esealas: Trastomo Conductual, Inquietud con 
Desorganizacidn, Sfntomas Psicosomaticos, 
Conducta Antisocial, Ansiedad Tcmerosa, Pro- 
blcma dc Aprendizajc-Inmadurez, Obsesividad 
e Hiperactividad-Inmadurcz. 

En todas las esealas Conners, padres, 
macstros o representantes de los padres califi- 
can los sfntomas en una escala de cuatro pun¬ 
tos (0 a 3). El formato dc las diversas esealas 
Conners es de la siguiente naturaleza: 

Dc Solo Bas- Mucho 

ningu- un tante 

na ma- poco 
nera 

Llora con 
facilidad 
Inquieto e 
intranquiio 
Actua sin 
pensar 
Desobcdccc 
a los adultos 
Se mete en 
problcmas 
Fantasea 

Trites, Blouin y LaPrade (1982) llevaron a cabo 
un an&lisis factorial de la CTRS-39 con una 
muestra alcatoria estratificada dc gran tamafio 
con 9 583 escolares canadicnscs. Los resultados 
produjeron seis factores. El primero —y con 
mucho el mds destacado— fue el de Hi¬ 
peractividad, que presentd cargas en 17 dc los 
39 reactivos y ex plied 36% de la varianza. El 
factor dc Hipcractividad tambidn tuvo cxcclente 
consistencia interna (coeficicntc alfa de .94). 
En otros cstudios sobre listas de verificacidn 
de la conducta infantil, la hiperactividad surge 
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como cl factor principal y mis fucrtc cuando 
se realizan andlisis factoriales de los reactivos 
de las escalas (Trites, 1979). 

La evidencia dc la validcz dc las cscalas 
Conners cs sustancial e incluye los siguientes 
elementos (Martens, 1992): 

* Las calificaciones de escala muestran cam- 
bios apropiados cuando se trata a los ninos 
hipcractivos con mcdicamcntos que se sabe 
que mejoran la atencidn. 

* Las cscalas de calificacidn poseen correla- 
cioncs positivas fuertes con otras escalas de 
calificacidn, calificaciones de compafieros y 
observaciones independientes. 

* Las puntuaciones de escala discriminan de 
manera apropiada entre grupos diagndsticos. 

A pesar dc la voluminosa base de investigaci6n 
que sustcnla estos instrumentos, los revisores 
expresan prcocupacidn acerca de las niuestras 
de cstandarizacidn. Por cjcmplo. las normas de 
la CPRS-48 parecen basarsc en una mucstra 
de 529 ninos casi exclusivamentc de raza blan- 
ca del drea dc Pittsburgh, que pueden no ser 
representativos de la poblacidn general (Martens, 
1992; Oehler-Stinnett, 1992). 

Los editores dc pruebas han publicado en 
anos recientcs una cantidad casi abrumadora 


de listas de verificacidn del TDAH y de otros 
problcmas conductualcs de la infancia. La ma¬ 
yor parte de estos instrumentos est4n disena- 
dos para que los utilicen padres y macstros en el 
contcxto dc la cvaluacidn escolar. Por ejemplo, 
Achcnbach (1991, 1992) ha publicado versio- 
nes revisadas de su Child Behavior Checklist, 
CBCL (Lista de Verificacidn Conductual para 
Nifios) para padres-informantes. un instmmento 
sumamente respetado que evalua problemas 
sociales y competencia acackfmica en una am- 
plia variedad de dominios conductuales. En el 
cuadro 10-7 sc rcsumen varios instrumentos 
nuevos. mds restringidos. 


EVALUACION DE 

a TRASTORNOS EMOCIONALES 
)Y CONDUCTUALES 


Aunque la mayoria dc los ninos se muestran dcs- 
preocupados y disfrutan ir a la escuela, todos 
los macstros citan casos similarcs al siguiente: 

Pedro era un nioo de nueve anos de edad que 
cursaba el tercer grado y cuyo desemperto aca- 
demico era Irregular. Sus padres expresaban pro- 
ocupacidn sobre su conducta ansiosa y retraida 


Cuadro 10-7. Dominios evaluados con las escalas de calificacion para 
los Trastomos por Deficit de Atencidn y Trastornos Relacionados 


Dominios 


Escalas 


ACTeRS 

ADDES 

ADHDT 

CAAS 

Inatencidn 

• 

• 

* 

• 

Conducta/Agreslvidad 




• 

Hiperactividad 

• 

• 

• 

• 

Impulsividad 


• 

• 

• 

Oposicional 

a 




Habilldades sociales 

• 





ACTeflS - ADO-H Comprehensive Teachers Hating Scale-Znd Edition (Escata Amplla de CalHtcadOn del Maestro-2a edlckbn). 
(Ullman, Sleator y Sprague. 1 98a) 


ADDES ■ Attention Deficit Disorders Evaluation Scales (Escalas de Evaluaadn de los Traslomos por Deiicii de AtenaOn, WcCamey, 1 989) 
ADHDT . Attention-Deficit Hyperactivity Disorder Test (Pruetxa del Trastomo por D«iot de AtenctOn con Hiperacttvidad. Gilliam, 1994) 
CAnS • Children's Attention and Adjustment Survey (Examen de AlenoOn y AdaptaaOn Inlantil. Lambefl. Hansoogh y Sandoval, 1990) 
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en el hogar. So maestra notaba clertas conduc- 
tas sociales "extranas", como nunca ver a los 
olros ninos a los ojos. grltar y hacer sonldos ra- 
ros en el patio de recreo y parecer demasiado 
ansioso por complacor a otros durante los jue- 
gos. Pedro tambien parecla demasiado preocu- 
pado por conservar sus libros, papeles y Apices 
en un orden rfgido sobre su pupltre. Pasaba mu- 
chos minutos diariamente ordenando y votvien- 
do a ordenar estos materialos. 

^Qud le sucede a Pedro? ^Cudl es la funcidn 
del psicdlogo escolar en cuanto a tratar los pro- 
blemas aparentemente emocionales dc cstc 
nifio? 

Ademds dc evaluar la discapacidad para el 
aprendizaje, los psicdlogos cscolares lambidn 
llevan a cabo valoraciones para determinar si 
los niflos satisfacen los criterios de un trastor- 
noemocional oconductual grave. Desde 1975, 
con la Ley Publica 94-142, el Congreso de EU A 
estipuld que los niflos con graves trastomos 
emocionales o conductualcs eran elcgibles para 
obtener los servicios especiales subvencionados 
dc mancra indirecta por el gobierno federal. Dc 
aquf que, para propdsitos dc idcntificacidn, sub- 
sidios y iratamiento, los psicdlogos escolares 
tengan que determinar si los nifios dcsignados 
tienen un trastomo cmocional o conductual. 

La ley federal clasifica a estos ninos como 
“con Trastorno Emocional Grave” (TEG). El 
proceso por el cual se identifica la presencia de 
un TEG en un cstudiante implica entrevistas 
con padres y maestros, valoracidn con escalas 
de calificacidn conductual y observacidn directa 
en el saldn dc clases. La meta consistc en iden- 
tificar a los niftos que exhiben conductas, sen- 
timientos o patrones dc interaccidn social 
inapropiados. En este caso sc centra la aten- 
cidn en la funcidn de las escalas dc calificacidn 
conductual dentro de este proceso, debido a que 
proporcionan un enfoque relativamente objeti- 
vo para la evaluacidn. 

En una escala de calificacidn conductual 
para nirios, se pidc a informantes como padres 
y maestros, que califiquen a un nifio en rclaci6n 
con conductas relativamente aisladas, como gus- 
ta de cstar solo, se mete en peleas, es par- 
lanchin, propenso a accidentes, se lleva 
con los demds y asf sucesivamente. Las califtca- 


ciones pueden ser dicotdmicas (si-no), pero se 
presentan mds en un continuo de 3 o 4 puntos 
(p. ej., nunca, en ocasiones, con frecucncia, 
siempre). Los reactivos se agrupan en escalas 
derivadas a travds de andiisis factorial que pro- 
ducen percentiles u otras calificactones en re- 
ferencia a muestras de estandarizacidn de niilos 
razonablementc normales (es decir, no canali- 
zados). Se han desarrollado varias docenas de 
escalas de calificacidn conductual segun csta 
estrategia. En el cuadro 10-8 se presentan al- 
gunos de los instrumentos de esta naturaleza 
que tienen mils utilizacidn. En nuestro caso se 
centra la atcncidn en una herramienta que po- 
see fundamentos empfricos extensos, la Child 
Behavior Checklist, CBCL (Lista de Verifica- 
cidn Conductual para Ninos; Achenbach, 1991). 

CHILD BEHAVIOR CHECKLIST 

La CBCL es una de las escalas mds cuidadosa- 
mente disenadas y dcsarrollada de modo mds 
minucioso en toda la psicologfa clfnica. De he- 
cho, el instrumento sc presenta en formas dife- 
rentes, dependiendo dc la edad del nino y de si 
la ban dc responder los padres o maestros. En 
este caso se restnnge el andlisis a la CBCL/4-18, 
adecuada para los informes dc los padres acer- 
ca de capacidades y problemas en nifios dc 4 a 
18 afios dc edad (Achenbach. 1991). El origen 
dc esta herramienta multidimensional data de 
1966, cuando Achenbach analizd mds de 600 
historialesclfnicos de ninos para idcntificarsfn- 
tomas aislados relativamente fdcilcs dc observar 
y que tambidn pueden considcrarsc gcncrales 
mds que demasiado especfficos. La invest!ga- 
ci6n y examen posteriores resultaron en mds 
de 100 reactivos que conforman la parte dc pro¬ 
blemas conductuales de la CBCL. £stos se ca- 
lifican con 0 (no es cierto hasta donde usted 
sabe), 1 (un tanto o en ocasiones cierto) o 2 
(muy cierto o a menudo cierto). Ademds, el ins¬ 
trumento incluye reactivos que detectan com- 
petcncia social en tres catcgorias amplias: 
actividadcs, social y escuela. 

Con base en numerosos estudios analftico 
factoriaies, Achenbach descubri6 que los padres 
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Cuadro 10-8. Listado breve de 
escalas representatives de calificacidn 
de la conducta infantil 


Revised Behavior Problem Checklist 
(Lista de Verificacidn de Problemas Conduc- 
tuales -Revisada) 

Quay y Peterson (1983) 

Esta escala consiste de 89 reactivos, cada uno 
de los cuales se calilica en una escala de grave- 
dad de Ires punlos; esta produce seis dimensio- 
nes primarias; problemas conductuales, agresion 
socializada, problemas de atencidn, ansiedad- 
relraimienlo, conducla motora y exceso motor. 

Behavior Assessment System (or Children 
(Sistema de Evaluacldn Conductunl para 
NiAos) 

Reynolds y Kamphaus (1992) 

Esta escala es un Instrumento global que incluye 
versiones para padres, maestro y ninos; la escala 
produce puntuaciones en dominios amplios de ex- 
ternalizacidn e internalizackJn, as! como en Areas 
especlficas de contenido que incluyen agresion, 
hiperactividad, problemas conductuales, problemas 
de atencidn, depresion, ansiedad, retraimiento, 
somatizacidn y habilidades sociales. 

Home Situations Questionnaire 
(Cuestionario de situaciones hogareAas) 

Barkley y Edelbrock (1987) 

Esta escala consiste en 16 reactivos que tratan 
sobre situaciones hogarenas en las que pueden 
ocurrir conductas de falta de obediencia (p. ej., al 
nino se le pide que realice tareas); los padres 
califican cada reactivo en una escala de nueve 
puntos. 

Social Skills Rating System 
(Sistema de Calificacidn de Habilidades 
Sociales) 

Gresham y Elliott (1990) 

Oisponible en formas para padres, maestro y 
autocalificacion, Asle es un cuestionario de 55 
reactivos que propordona inlormactdn especifica 
en Ires dominios (habilidades sociales, conductas 
problems y competencia academica). 


tienden a describir los problemas de los ninos 
en ocho dimensiones: conducta agresiva, ansie- 
dad/depresi6n, problemas de atencidn, conducta 
delincuente, problemas sociales, padecimicntos 
somAlicos, problemas de pensamiento y retrai¬ 
miento. Estos patroncs dc escala se derivaron 
de los anAlisis factoriales de las calificaciones 
para 4 4SS ninos con canalizacidn clfnica. Los 
resultados sc expresan como percentiles en 
comparacidn con una muestra normativa de 
2 368 ninos no canalizados. AdcmAs de las pun¬ 
tuaciones para las escalas individuates, la CBCL 
produce una puntuacidn dc Intemalizacidn (los 
problemas se intemalizan). una puntuacidn de 
External izacidn (los problemas se extemalizan) 
y una puntuacidn Total Problema (que rcfleja 
una desadaptacidn general). 

Considdrcnse los resultados dc prueba de 
Pedro, el alumno problemAtico dc lercer grado 
que sc dcscribid antes. Un aspecto valioso de 
la CBCL es que pueden compararse las califi¬ 
caciones dc ambos padres como una especie 
dc verificacidn de confiabilidad. Los rangos 
percentiles para las calificaciones de su madre 
y padre se listan, rcspcctivamcnte, a continua- 
cidn, donde las puntuaciones mAs altas indican 
un problema mayor: 


Conducta agresiva 

52, 

65 

Ansicdad/Dcpresidn 

98, 

91 

Problemas dc atencidn 

98, 

98 

Conducta delincuente 

34, 

45 

Problemas sociales 

93, 

91 

Padecimientos somAticos 

88, 

89 

Problemas dc pensamiento 

98, 

77 

Retraimiento 

95, 

95 

Puntuacidn total problema 

98, 

98 


En general, los resultados se encuentran denlro 
del rango clinico (la puntuacidn Total Proble¬ 
ma se encuentra en el percenlil 98). Las escalas 
individuates indican que sc percibe a Pedro 
como sumamente relrafdo, ansioso/deprimido, 
con posibles problemas de pensamiento (p. ej., 
pensamientos extranos o pcculiarcs) y con una 
dificultad evidente para prestar atencidn. La 
evaluacidn posterior realizada porel psic61ogo 
escolar reve!6 una inteligencia promedio (Cl 





■ 


Ambientes especlales para la evaluaclon psicoldgica •445 


Total dc 94) con una enormc discrepancia en- 
tre capacidad verbal (CIV de 110) y capacidad 
dc desempefio (CIE de 79). En cnlrevista, Pedro 
revcld un tipo de pensamiento vago, desordc- 
nado, con notable distraccidn. En general, los 
resultados indicaron que calificaba para un diag- 
ndstico de TEG y que requerfa de servicios psi- 
coldgicos especiales en la cscuela. 

■ EVALUACI6N DE 1ALENTOS 

ESPECIALES _ 

Un ideal de las socicdades occidcntalcs cs que 
cada persona deberfa recibireducacidn adccua- 
da para satisfaccr sus potencialidades. Este ideal 
no sdlo cs consistente con cl igualitarismo pre- 
valeciente, sino que lambidn demuestra una 
polftica astuta en la medida en que la educa- 
cidn adecuada para las personas muy inteligen- 
tes paga elevados dividendos para la socicdad 
cn general. Se considera talcntoso al individuo 
que desarrolla conccptos cientfficos originates 
y cficaccs; descubre la cura para los males dc 
la humanidad; produce grandcs obras de arte e 
inventa productos, herramientas y maquinas 
utiles. La identificacidn temprana de los nifios 
dotados cs escncial si se han dc nutrir sus ta- 
lentos en beneficio de todos.* 

Por lo general, la designacidn dc una per¬ 
sona como talentosa significa que tiene una 
capacidad extraordinaria en cierta drea 
(Horowitz, 1994). Rcnzulli (1986) scfiala que 
dentro de esta dcfinicidn general, los expertos 
han seguido dos categorfas amplias de talcnto 
especial, que podrfan denominarsc “talentos 
escolares” y “talentos crcativos-productivos”. La 
pnmera variedad la representan los estudiantes 
que sobrcsalcn en las metas acaddmicas tradi- 


* Dcbido a que dstc cs un libro sobro pruebas psicold- 
gicas, no sc puedc analizar las tcndcncias cn cuanto 
al financiamiento dc la cducacidn para los individuos 
talcntosos. No obstante, es dcsalentador observar que 
cn cl dcccnio dc 1990, rnenos dc una ddcima parte 
de 1 % dc todos los recursos fcdcralcs gastados cn la 
cducacidn primaria y secundaria se dirigicron a pro- 
gramas para personas talcntosas (Irwin, 1992). 


cionales como la escritura, matematicas o cien- 
cias. Podrfa dcscribirse a estos nifios como per¬ 
sonas que posecn talentos intelecluales. En 
cuanto a esta variedad dc talcnto, Rcnzulli 
(1986) sefiala que: 

Exisle en diversos grados; se le puede klentili- 
car a travds de tacnicas eslandarizadas de ova- 
luacidn y, por tanto, debomos bacer todo lo que 
esl6 en nuestro poder por realizar modificacio- 
nes apropiadas para los estudiantes quo tienen 
la capacidad para cubrir el material curricular re¬ 
gular a tasas y niveles de enlendimiento avanza- 
dos (p. 57). 

Este tipo de talento especial puede evaluarse 
con facilidad a travds dc pmebas de Cl o dc 
otro tipo de pruebas de capacidad y rendimicn- 
to. La segunda categorfa dc talentos especia¬ 
les, los creativos-productivos, es rods diffcil 
de valorar. La identificacidn del talento dentro de 
esta drea dependc dc procedimientos mds sub- 
jetivos —pocas pruebas son adccuadas para este 
propdsito. 

Quizds dsta es una de las razones por las 
que los sistemas escolares a menudo restringen 
el concepto dc talentos especiales al drea inte- 
lectual y dependen de pruebas eslandarizadas 
para la identificacidn de nifios clcgiblcs. El 
punto en el que la capacidad intelectual es sufi- 
cicntcmcnle elevada como para clasificar al 
nifio como superior al nivel mental o talcntoso 
cs, por supuesto, una dccisidn un tanto arbitra- 
ria. Un enfoque tfpico consiste en reservar la 
ctiqueta de talcnto especial (y proporcionar ac- 
ccso a mejores oportunidades cducativas) para 
los estudiantes que obtienen puntuacioncs en 
1 % superior dentro de pruebas estdndar de in- 
teligencia, como las esealas Stanford Bind o 
Wechsler. Esto se traduce en un Cl de aproxi- 
madamente 135 y superior. En resumen, un en¬ 
foque para la idcntificaci6n de nifios talentosos 
implica la nominacidn de un maestro o padre, 
la aplicacidn dc una prueba individual dc Cl 
apropiada y despuds la seleccidn de los nifios 
para experiencias educativas enriquecidas, con 
base en una puntuacidu suficicntemente eleva¬ 
da dc una prueba. 

Una extensidn del enfoque basado en una 
prueba para la identificacidn de los talentos es- 
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colares o intclectuales es el empleo de un siste- 
ma de calificacidn cuantitaliva que incorpore 
datos de prueba, calificaciones escolares y re- 
comendaciones del maestro (cuadro 10-9). Este 
metodo proporciona una plataforma mds esta- 
ble para la identificacidn del talcnto intelectual. 

CONCEPTO CREATIVO-PRODUCT1VO 
DE LOS TALENTOS ESPECIALES 

Con base en la sospecha de que las prucbas 
tradicionalcs dependen demasiado del conoci- 
miento, experiencia y contenido cspecfficos. los 
educadores han propucsto un enfoque alterna¬ 
tive para la dcfinicidn c idenlificacidn de nirtos 
talentosos. Los talentos creativos-productivos 
se refieren a aquellos que poseen niflos (y 
adultos) que sobresalen en el desarrollo de pro- 
ductos y materiales originates (Sternberg y 
Zhang, 1995). Encontrar a estos nirtos obliga a 
“buscar por debajo de 3 a 5% superior en la 
curva normal de puntuaciones de Cl” (Renzulli, 


1986, p. 58). Dc hecho, pocas prucbas son uti¬ 
les para localizar estos talentos. La identifies- 
cidn de estos nifios depende en gran medida del 
juicio subjetivo de autoridadcs (incluyendo 
maestros y psicdlogos) que deben aplicar 
dcfiniciones conceptualcs de los talentos cs- 
peciales para las circunstancias espcdficas de 
los nihos individualcs. 

La perspccti va sobre talentos cspecialcs que 
ofrecc Renzulli (1978, 1986) sirve para ilustrar 
este enfoque alternative. Este autor 1c resta im¬ 
portance a la funcidn del Cl, y en vez de ello 
define los talentos especiales como la confluen¬ 
ce dc tres elementos: 

1. Inteligencia superior al promedio. 

2. Evidencia dc creatividad. 

3. Evidencia de compromiso con la tarea. 

El primer clemento especifica una capacidad 
superior al promedio, pero no necesariamente 
sobresaliente odotada. Scgun este punto dc vise, 
un nifio talentoso es aquel que poscc capacidad 


Cuadro 10-9. Pautas de muestra para la identificacidn 
de talentos intelectuales especiales 


Categorfa 

Rango de puntuaciones 

Valor Ponderado* 

Datos de prueba de inteligencia 

percentil 95-99 

10 


92-94 

8 


89-91 

7 


86-88 

6 


80-85 

5 

Datos de prueba de rendlmiento 

percentil 95-99 

8 


92-94 

7 


89-91 

6 


86-88 

5 


80-85 

4 

Calificaciones escolares 

A o 96-99 o Superior 

8 


B o 91-95 o Muy bien 

7 


C o 80-90 o Bien 

6 

Calificaciones del maestro 

El mds prometedor en clase 

5 


Estudiante excelente 

4 


Superior al promedio 

3 


Promedio 

2 


* Punluacibn maxima posible = 31 y se necesitan 28 punlos para identilicar a un esludiante como talentoso 

Fuenle: Basado en Gallagher, J. J. y Courtright. R D (1986) The educational definition ol giltodness and its policy implication*. En 

R J. Sternberg y J. E Davidson (eds ), Conceptions ol gMedness Cambridge. Cambridge University Press. 
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general superior al promedio (digamos un Cl 
de 115 o mayor) o un talento rcconocido en un 
4rea especifica, como qufmica, ballet, mate- 
mdticas, composicidn musical, esculpido y fo- 
tograffa. Micntras la capacidad general y 
muchos talentos especfficos pueden medirse 
con pruebas estandarizadas, algunas ircas como 
las artfsticas deben valorarse a travds de tdeni- 
cas de evaluacidn basadas en cl desempeno. 

El segundo elemento esencial es que los ni- 
fios talentosos revelan brotes repentinos de crca- 
tividad en sus actividadcs, pero, ^qud cs la 
creatividad y c6mo se le puede evaluar como un 
elemento de los talentos creativos-productivos? 
La evaluation de la creatividad ha fascinado a 
los psicdlogos y educadores durante decenios 
—y tambidn ha rcsultado ser un problema enig- 
matico. Aunque en general los investigadores 
reconocen que la creatividad es un tanto dife- 
rentc de la inteligencia, mis alia de cslc punto 
fundamental existe poco acucrdo en cuanto a 
la naturaleza o evaluacidn de la misma (Wallach, 
1985). 

A lo largo de los afios, la creatividad se ha 
definido como un proceso, una caracterfslica 
personal y un producto conductual (Amabile, 
1983). Un cjemplo de la pcrspcctiva de proce¬ 
so es la idea de que las personas creativas so- 
brcsalen en un proceso cognitivo espeeffico 
llamado production divergente: 

La produccton divergente se define como del llpo 
que se dispara en dlrecciones dilerentes. Hace 
posibles los cambtos de diroccibn en la solucibn 
de problemas y tambidn conduce a una diversi- 
dad de respuestas, donde mas de una de ellas 
puede ser aceptable (Guilord, 1959). 

Un ejemplo de una medida de produccidn di¬ 
vergente cs la Consequences Test (Prueba de 
Consccuencias; Guilford y Hocpfner, 1971). 
Algunas de estas medidas incluyen preguntas 
como: "^cuiles serfan las consecuencias si las 
nubes tuvieran cordeles colgando de ellas?"; 
VuAles serfan las consecuencias si las bombi- 
llas eldctricas costaran $100 cada una?”; “^cui- 
les serfan las consecuencias si los oedanos se 
elevaran tres metros?”. El numero de respues- 
las dadas se considera como un fndice de pro- 


duccidn divergente que, a su vez, se considera 
como evidcncia de creatividad. Estas pruebas 
han disfrutado de popularidad periddica, pero 
su valor como medidas de creatividad aun es 
cucstionable. 

Olro punto de vista acerca de la creativi¬ 
dad es que los rasgos personates representan 
su probable prescncia. Segun esta pcrspcctiva. 
la creatividad proviene del temperamento, moti- 
vacidn y caricter del individuo; esto sugcrirfa 
que existe una pcrsonalidad creati va. Harrington 
(1975) ha capturado una representacidn no del 
todo halagadora de la persona creative en su 
escala de Composite Creative Personality (Pcr¬ 
sonalidad Creativa Mixta). Esta prueba es una 
lista de verificacidn de adjetivos: las personas 
crcativas se distinguen al calificar en sf mis- 
mas la prescncia de cicrtos rasgos que incluyen 
argumentador, asertivo, apresurado, perspicaz, 
rebelde, espontaneo y versitil, entre otros. Esta 
Ifnea de investigacidn indica que las personas 
creativas se distinguen por intercscs, actitudes 
y motivaciones y no s6lo por la capacidad inte- 
lectual. No obstante, cl vfnculo es indirecto e 
imperfecto. En consecuencia, las medidas de 
personalidad en pocas ocasiones ayudan a la 
idcntificacidn de los cstudiantes talentosos. 

El ultimo enfoque para la creatividad uti- 
liza el producto como signo distintivo de esta 
capacidad. Segun cste punto de vista, las per¬ 
sonas creativas produccn cosas (ideas, inven- 
tos, cscritos, produccidn artfstica, etc.) que 
satisfacen ciertos criterios. Por cjemplo, Jackson 
y Mcssick (1968) aplican cuatro criterios a un 
producto creati vo. 

• Novedad: los productos creati vos son nue- 
vos o al menos representan una aplicacidn 
nueva a lo que ya es familiar. 

• Idoneidad: el producto debe ser apropiado 
para el contexto y no solamentc novedoso. 

• Trasccndcncia de las rcstricciones: un pro¬ 
ducto trasciende cuando va mis alii de lo tra- 
dicional. 

• Fusion de significado: al principio, cl valor 
de los productos creativos puede no ser apa- 
rente; es posible que la importancia completa 
se aprecic s61o con el tiempo. 
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Gstos criterios puedcn utilizarse para idcntifi- 
car a nifios quc pareccn demostrar crcatividad, 
uno de los elcmcntos de los (alcntos crcativos- 
produclivos; sc requicre del juicio subjetivo para 
idcntificarlos —no existen pruebas o escalas de 
calificacidn disponibles para cste propdsito. 

El tercer elemento cscncial en los talentos 
creativos-productivos es la evidcncia del com¬ 
promise con la tarea. En la dedicacidn y pasion 
que ponen en sus fines, los nifios talentosos 
sorprenden a padres y maestros par igual. Di- 
chos ninos pasan voluntariamente lanto liempo 
en la busqueda de sus talentos como sus com- 
pafieros lo ocupan en ver televisidn (Renzulli, 
1986). En los cstudios clfnicos sobre nifios 
talentosos, las cualidades de persistencia, re- 
sistencia, participacidn, persevcrancia, trabajo 
intenso, dedicacidn y confianza en sf mismos, 
se mencionan una y otra vez (Terman y Oden, 
1959). La cvaluacidn del compromiso con la 
tarea requiere de un enfoque subjetivo, aunque 
una cspecificacidn operacional podrfa ser que 
el candidato clegiblc debe haber mostrado una 
pasi6n por su irea de talento durante un perio- 
do espccffico (digamos que, cuando menos, 
durante un afio o mis). 

Rccicntemente, varios expertos han expre- 
sado preocupacidn porque el concepto de ta¬ 
lento especial se haya definido desdc una 
perspcctiva cultural eurocentrista, de tal modo 
quc sc pasa por alto a muchos estudiantes de 
minorfas sin que sc les reconozca (Hamilton, 
1993; Maker, 1996). La dependencia extrema 
en las puntuaciones de prueba se considera par- 
ticularmente problemilica cn la medida en que 
las pruebas existentes son medios cuestionablcs 
de prediccidn del dxito en ambientes no acadd- 
micos —cn especial para grupos de minorfas 

RIresumen 

1. La deteccidn de la preparation para la es- 
cucla cs una importante funcidn de la eva- 
luacidn dentro de los sistemas escolares. 
Una prueba util de detecci6n deben'a pro¬ 
duct tasas de falsos negalivos mcnores a 
20%, y de falsos positivos de menos de 


etnicas, culturales y lingUfsticas. Como un re- 
medio. Maker (1996) rccomienda que los cdu- 
cadores utilicen pricticas de idcntificacidn que 
se orienten al proceso y se basen en el desem- 
peno (en contraposicidn a las puntuaciones de 
prueba). Esla autora desarrolld un enfoque au- 
tdntico para la identificacidn de nifios talentosos 
de minorfas que se denomina DISCOVER , cn 
el que grupos de alumnos de primaria resuel- 
ven problemas con cubos, rompccabczas de 
figuras geomdlricas, libros de accrtijos y ju- 
guetes: 

B prop6sito es crear una sltuac*6n de solucton 
de problemas similar a la que podria ocurrlr en 
un saldn de clases a prop la do para esludianles 
talentosos de dlversos antocedentos culturales, 
itnicos, econdmicos y lingufsticos. 

Los nifios pasan por Ires o mis actividadcs, 
mientras los observadores documentan los pro- 
cesos y habilidadcs de solucidn de problemas. 
Despuds, los observadores llcnan una lista de 
verificacidn con 82 reactivos que tiene el pro- 
pdsito de identificar a los estudiantes talento¬ 
sos. Dcbido a que los nifios utilizan materiales 
concretos, pueden expresar lo que Gardner 
(1992) denomina conocimiento de "primer or- 
dcn’\ el cual implica la creacidn y comprcnsidn 
de historias, musica, dibujos, conslrucciones y 
explicaciones. Estc tipo de conocimiento de- 
pende menos del aprendizaje y rendimiento aca- 
ddmicos en el sistema simbdlico quc sc ensefia 
en la escuela y, por tanto, se Ic considera como 
un fndice mis preciso de las capacidadcs de 
ninos que provienen de antecedentes diversos. 
El enfoque DISCOVER recuerda quc cl talento 
especial puede verse desdc muchas perspecli- 
vas —no necesariamentc es una cosa. 


10%. Por desgracia, los instrumentos de 
deteccidn existentes pocas vcces satisfa- 
cen estos criterios. 

2. Instrumentos utiles para la deteccidn cn edu- 
cacion preescolar incluyen los DLAL-R, quc 
evaluan habilidades motoras, conceptos 




Amblentes especlales para la evaluation pslcologlca • 449 


cognitivos y habilidades del lenguaje; la 
Denver II, quc evalua el desarrollo en cua- 
tro fircas-pcrsonal-social, motora fina- 
adaptativa, lenguaje y motora gruesa; y la 
HOME. 

3. La HOME es un fndice del ambiente del 
nino que se basa en la observaci6n dentro 
del hogar y la cnirevista con la principal per¬ 
sona cncargada del cuidado del nino. El in- 
ventario midc la calidad y cantidad dc 
cstimulacidn y apoyo para el desarrollo 
cognitivo, social y emocional que el nino 
tiene a su disposicidn en el hogar. 

4. A corto plazo, es probable quc no cxista un 
mejor fndice del riesgo que corre un nino 
de fracasar en la escuela que una prueba 
individual dc intcligcncia como la o las 
DAS. 

5. Con base en la Ley Publica 101-476, una 
extensidn dc la Ley Publica 94-142, la 
definicidn federal dc DA (definidas como 
una discrepancia significativa entre inteli- 
gencia y aprovechamiento) ha perdido el 
favor dc los expertos en cl campo dc la 
DA. Una definicidn mds novedosa hace re¬ 
ferenda a una debilidad intraindividual en 
una o mds dreas centrales de funcionamicn- 
to acaddmico (capacidadcs dc audicidn, 
habla, lectura, cscritura, razonamiento o ma- 
tcmdticas) como la caracterfstica esencial 
de la DA. 

6. Existe un acuerdo general —con ocasiona- 
les votos en contra— accrca dc las siguicn- 
tes caractcrfsticas de las discapacidadcs para 
el aprendizaje, dstas implican una discre¬ 
pancia intraindividual en cuanto a funcio- 
namiento cognitivo; una cxclusidn de otros 
padccimiento discapacitantes como la cau¬ 
sa principal; heterogeneidad, es decir, la 
existencia de muchos subtipos diferentes; 
una continuidad en el desarrollo desdc la 
infancia hasta la edad adulta; y una alta in- 
cidcncia dc consccucncias socialcs y emo- 
cionales. 

7. Una de las pruebas individuates representa- 
tivas de rendi miento que se uliliza en la eva- 
luacidn de la DA es la K-TEA, una prueba 


sin Ifmitc de tiempo para nifios de 6 a 18 
anos dc edad, que consiste en cinco subprue- 
bas: Decodificacidn de Lectura, Comprcn- 
si6n de Lectura, Aplicacioncs MatemSti- 
cas, Cfilculos Matcmiticos y Ortograffa. 

8. Las puntuaciones de subprueba de la K-TEA 
pueden convertirse a cquivalentes de grado 
y puntuaciones cstdndar con media de 100 y 
DE de 15. Tambidn es posible rcalizar un 
andlisis cualitativo de los errores en las sub- 
pruebas, lo cual mejora la utilidad educativa 
de la K-TEA. La estandarizacidn, con- 
Fiabilidad y validez de contenido parecen 
ser buenas, aunque serfa descable rcalizar 
estudios test-retest adicionalcs. 

9. Dcbido a quc el trastorno por deficit de aten- 
ci6n con hiperactividad (TDAH) a menudo 
coexiste con la DA, los profcsionales re- 
quieren de herramientas y conccptos para 
la evaluacidn de cste trastorno. Los crite- 
rios del DSM-IV para el TDAH destacan 
inquietud, distraccidn, impulsividad, dcfi- 
ciencias de atenci6n, habilidades socia- 
les deficientes y falta de consideracidn dc las 
consecuencias. Otros enfatizan como sfn- 
tomas diagndsticos las deficiencias en res- 
pucsta demorada, sostenida o ambas. 

10. Conners ha desarrollado una familia de es- 
calas de calificaci6n para la idenlificacidn 
de hiperactividad y de otros problemas 
conductuales en nihos. Maestros, padres y 
cncargados dc atendcr a los nihos califican 
los sfntomas en una eseala de cuatro puntos. 
Estos instrumentos y otras escalas de cali- 
ficacion como la Child Behavior Checklist 
de Achcnbach son complementos utiles en 
la cvaluacidn de la conducts problema 
en nifios. 

11. Un nifio con trastorno emocional grave 
(TEG) exhibe conductas, sentimienlos o 
patrones de interacci6n social inadecuados. 
Las escalas objetivas como la CBCL son 
utiles para la cvaluacidn del TEG. Uno o 
ambos padres califican los reactivos en la 
CBCL con 0 (no cierto), 1 (un tanto cierto 
o en ocasiones cierto) o 2 (muy cierto o a 
menudo cierto). 
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12. Otra funcidn del psicdlogo escolar es evaluar 
los lalentos especiales, que se reficren a la 
capacidad extraordinaria cn alguna area. F.s 
frecuente que sc identifique a los ninos ele- 
gibles a travds de un alio Cl cn una prueba 
individual dc inteligencia. pero pueden utili- 
zarse olros enfoques. Algunos expertos ha- 


StErMINOS Y CONCERTOS CLAVE 


Dcteccidn P- 420 

Sensibilidad P* 422 

Especificidad P* 422 

Discapacidad para el 

aprendizaje P- 428 


cen referenda a la inteligencia superior al 
promedio, creatividad y compromiso con 
la tarea conio ingredientes importantes dc 
los lalentos especiales. Este enfoque se basa 
en gran medida cn el juicio subjetivo de auto- 
ridades (administradores. psicdlogos) para 
la identiftcacidn de los niftos talentosos. 


Trastorno por deficit dc atencidn 


con hiperactividad . P- 438 

Talentos especiales P- 445 

Creatividad P- 447 

Produccidn divergente P- 477 






Tema 10B 

Aplicaciones forenses de la evaluacion 


Normas para el lestimonio experto 
Valoracibn de presunta simulacion 
Evaluacibn del estado mental para la defensa de insania 
Competencia para estar sujeto a juicio 
Predkxibn de la violencia y evaluacibn del riesgo 
Valoracibn de custodia de los ninos en el divorcio 
Lesbnes personates y testimonio relacionado 
Interprelacbn de prueba de polfgralo 
Controversia sobre el psicblogo como lestigo experto 
Resumen 

Tbrmrnos y conceptos clave 


-T—--- 





Lki psicologfa y cl sistcma legal han teni- 
do una alianza larga e intranquila, caractcrizada 
por la desconfianza de ambas partes. Dcntro 
del sistema legal, abogados y jueces conservan 
una anlipatfa hacia cl testimonio de los psicblo- 
gos, debido a una preocupacibn de que sus 
opiniones se basen en “ciencia falsa" (o quizes 
en ninguna ciencia en absoluto) y tambien de¬ 
bido a una creencia (no del todo infundada) de 
que algunos testigos expertos profesardn casi 
cualquier punto de vista que sirva a los intercses 
del acusado. Dentro de la profesibn de la salud 
mental, los psicblogos considcran que el as- 
pecto de antagonismo del testimonio en un tri¬ 


bunal —basado en la expectativa de opiniones 
de si-no que se expresan como certezas 
virtuales— es un campo imposiblc en el cual se 
busca la verdad sobre la conducta humana. 
Como descubrirg el lector, esta tensibn esen- 
cial entre la Icy y la psicologfa cs un tcldn de 
fondo constante que moldea y da forma a la 
naturaleza de la prdctica psicolbgica en los tri¬ 
bunates. 

Para bien o para mal, los psicblogos sf rin- 
den testimonio en casos judiciales, y el centra 
de atencibn de su testimonio a menudo tiene 
que ver con la interpretacibn de pruebas psico- 
Ibgicas y entrevistas de evaluacibn. ^Cudndo 
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son admisibles cn una corte los rcsultados de 
prucba y las opiniones psicoldgicas basadas en 
ellas? iQud criterio sigucn los jueces cn la de- 
tcrminacidn de si cl testimonio psicoldgico debe 
admitirse? Los psicdlogos quc se presentan a 
sf mismos como expertos y utilizan las prucbas 
para justificar sus opiniones, deben tencr una 
sdlida fundamentacidn cn cuanto a las cueslio- 
ncs legates quc sc rdacionan con la cvaluacidn. 
En este tenia sc examinard la rclcvancia de las 
normas legales para el testimonio que se basa 
en pruebas y valoraciones psicoldgicas. Tam- 
bidn se examinardn algunos instrumentos es- 
pccializados utiles en la cvaluacidn forense. 

La funcidn del psicdlogo examinador puc- 
dc confluir con el sistema legal en una multi- 
tud de formas. Pucdcn solicitarsc los servicios 
del profesional para lo siguiente: 

• Valoracidn de presunta simulacidn 

• Evaluacidn del estado mental para la defensa 
de insania 

• Determinacidn de la competencia para some- 
terse a juicio 

• Prediccidn de violcncia y cvaluacidn del riesgo 

• Valoracidn de custodia de los ninos en el di- 
vorcio 

• Evaluacidn de lesioncs personales 

• Interpretacidn de prueba de polfgrafo 

Histns son las principales aplicaciones de la prdc- 
tica forense que se analizardn aquf. Una varie- 
dad de aplicaciones adicionales se analizan en 
Melton, Petrila, Poythress y Slobogin (1998). 

Ademds de satisfaccr las pautas generates 
de prdctica dtica que se requieren de cualquicr 
clfnico, los profcsionalcs que ofrecen testimo- 
nio experto basado cn pruebas psicoldgicas se 
enfrentardn con normas adicionales para la prdc- 
tica linicas del sistema de jurisprudence de 
EUA. Aquf se resumen las principales preocu- 
paciones conccmicntes a las pruebas psicold- 
gicas y el testimonio en tribunates. El lector 
puede cncontrar andlisis mds amplios sobre este 
tema cn Melton el al. (1998) y Wrightsman, 
Nietzel y Fortune (1994). 

Cada uno de los temas antes listados hace 
surgir preguntas unicas acerca de la funcidn del 


psicdlogo en un tribunal. No obstante, un asunto 
es comun a todas las formas de testimonio en 
una corte: ^Cudndo puede considcrarse como 
testigo experto a un psicdlogo? Se analiza esla 
cuestidn general antes de regresar a las aplica¬ 
ciones cspecfficas de la valoracidn psicoldgica 
quc confluycn con el sistema legal estadouni- 
dense. 


B NORMAS PARA EL TESTIMONIO 

EXPERTO _ 

De la misma manera cn que los psicdlogos sc 
ocupan de las cuestiones de normas y com¬ 
petencia, tambidn lo hacen los abogados y 
jueces. La jurisprudence cstadounidense ha de- 
sarrollado diversas pautas para el testimonio cn 
tribunales, incluycndo varias principios gene¬ 
rates rclacionados con el testimonio de un tes¬ 
tigo experto. Eslas normas sc cncuentran en 
Federal Rules of Evidence (1975) y se han 
confirmado a travds de varios diclfimenes judi- 
cialcs. Se pucdcn resumir los principios del les- 
timonio de expertos como sigue: 

• El testigo debe ser un experto calificado. No 
todos los psicdlogos a los que se pida atesti- 
guar sc les permitinS hacerlo; con base en un 
resumen de su educacidn, entrenamiento y 
cxperiencia, el juez decide si el testimonio 
de ese testigo es admisible. 

• El testimonio debe referirse a un tema apro- 
piado. En particular, el experto debe presen- 
tar informacidn quc sc cncuentre mds alld del 
conocimiento y cxperiencia del jurado pro- 
medio. 

• El valor de la evidencia en cuanto a determi- 
nar la culpa o inocencia debe superar su efec- 
to pcrjudicial. Por ejemplo, si el testimonio 
del experto puede provocar confusiones en 
cuanto al tema a discutir o causar que los 
miembros del jurado prejuzgucn la situacidn, 
en general no es admisible. 

• El testimonio de un experto debe ir de acuer- 
do con una teorfa explicativa aceptada en 
general. En la mayor parte de los tribunales, 
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las pautas sobrc esta cuesli6n las proporcio- 
na el caso de Frye contra EUA, un caso ju¬ 
dicial ocurrido cn 1923 relacionado con 
aceptabilidad del testimonio dc cxpertos. 

En este caso, los abogados de un indi viduo acu- 
sado dc homicidio intcntaron introducir los re- 
sultados de una prueba de cngafio a traves de la 
mcdicidn de la presidn sangufnca sistdlica. El 
abogado ofrecid la presencia de un expcrto para 
alcstiguar en cuanto a los resultados de dicha 
prueba. Se afirmd que la activacidn emocio- 
nalmente inducida del sistcma nervioso simpd- 
tico produce aumento gradual de la presidn 
sangufnca sistdlica si la persona cxaminada in¬ 
tenia enganar al examinador. En otras palabras, 
el tcsligo cxperto afirmd que en el curso dc un 
interrogatorio acerca dc un crimen, el patrdn 
de cambio en la presidn sistdlica podfa utilizar- 
sc como una forma dc prueba dc detcccidn de 
mentiras. La dcfcnsa deseaba que el experto 
atestiguara en apoyo a la inocencia del cliente. 
La parte acusadora estuvo en contra de cllo y 
el Tribunal de Apelaciones del Distrito de Co¬ 
lumbia avald la objccidn, dcclarando que: 

... ounquo los tribunales eslan mas que dispues- 
los a admitir el testimonio deducido de un prind- 
pio o doscubrimiento cientiltco blen reoonocido, 
aquello en lo que se basa la deduccidn debe 
haberse ostablocido a un nivel suliciente como 
para tener la aceptaclon general en el campo 
particular al que portenezca (citado en Blau, 
1984). 

El tribunal concluyd que la prueba de cngano 
por medio dc la presidn sangufnca sistdlica no 
habfa obtenido aceptacidn entre las autorida- 
des fisioldgicas y psicoldgicas y, por tanto, sc 
ncgd a admitir el testimonio del expcrto. 

Segun estas pautas, una prueba, inventario 
o tecnica de evaluacidn debe haber estado dis- 
poniblc durante un periodo lo suficicntcmcnle 
largo como para tener antecedcntcs de acepta- 
cidn general. Por tal razdn, el testigo experto 
prudcnteelegird instrumentos bien establccidos 
y ampliamente investigados como base para su 
testimonio, cn vez dc depender de pruebas dc 
dcsarrollo reciente que podrfan no soportar el 


conlrainterrogatorio bajo las limitaciones csta- 
blccidas por el caso Frye contra EUA. 

En 1993, las normas para cl testimonio ex¬ 
perto se refinaron nun tnds a travds dc la deci- 
sidn dc la Suprema Corte en el caso de Daubcrt 
contra Mcrrell Dow Pharmaceuticals. La 
opinidn por escrito dc este tribunal afiadid pau¬ 
tas amplias acerca de los factorcs a considerar 
en la ponderacidn del testimonio cicntffico cn 
juicios. En particular, la corte dictamind que 
una opinidn experta debe basarse cn “una infe- 
rcncia o afirmacidn ... dcrivada del mdtodo 
cienlffico”. Las ramificacioncs dc este dictamcn 
para el testimonio experto de los psicdlogos son 
poco claras; no obstante, algunos tribunales han 
utilizado el dictamcn de Daubert como base 
para impugnar cl testimonio de profesionales 
de lasalud mental, incluycndoa psicdlogos. Por 
ejemplo, un tribunal determind que las valora- 
ciones psicoldgicas de nihos que han sufrido 
abuso sexual eran inadmisiblcs como eviden- 
cia. Parecc probable que los tribunales deman- 
dardn cada vez mayores pruebas dc que cl 
testimonio dc los psicdlogos tiene una base cicn- 
tffica estricta (Melton y cols., 1998). 

iSJ VALORACION DE PRESUNTA 
gSIMUlAObN 


En la mayor parte de los ambientes, las psicd¬ 
logos pueden suponer de mancra segura que los 
clicntes son razonablemente honestos acerca de 
su estado mental y emocional. Los clientes quie¬ 
ten contar sus historias y descan transmitirlas 
de manera correcta. En el peor de los casos, 
pueden exagerar un tanto los sfntomas para per- 
suadir al clfnico de que la ayuda cs mcrccida y 
necesaria. Sin embargo, el engaiio y la mani- 
pulacidn abiertos son poco comunes —por la 
scncilla razdn de que no cs comun que los clicn¬ 
tes tengan inccntivo para estas estrategias. 

No obstante, las reglas de parlicipacidn clf- 
nica se voltcan dc cabcza cn los ambientes fo¬ 
re nses. El cliente forense tfpico tiene mucho que 
ganar dc una formulacidn del caso que enfatice 
la enfermedad y discapacidad. De hccho, cl 
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contexto de la evaluation casi garantiza quc los 
clienlcs tendrin el propOsito de parecer “locos" o 
discapacilados, ya sea por exageraciOn o (en 
ocasiones menos frecuentes) como estratagc- 
ma. En la mcnte del cliente forcnsc, la fabrica- 
ci6n de sfntomas pucdc scrvir como excusa para 
la conducta inaccptablc (p. ej., para favorcccr 
una defensa de insania), para influir sobre las 
recomendacioncs de condena (p. ej., contra la 
pena capital) o para obtener indemnizaciones 
(p. ej., certification de discapacidad). Las ma- 
quinacioncs de estos clientcs influycn clara- 
mente en la validez de las evaluaciones fo- 
renses. En cl fondo de loda evaluation de este 
tipo ronda la perturbadora pregunta: <cl cliente 
fuc razonablemente honesto y directo? 

El examinador forensc dcbc hacer un juicio 
sobre la honradez de la imagen que presenta el 
cliente durante la valoraciOn. Y, sin embargo, 
aunque el sentido comun dicta que el examina¬ 
dor debe esperar cierto grado de cngafio, para 
llegar a la conclusion de quc cl cliente ha simu- 
lado de manera const iente, se nccesita tencr pre¬ 
caution: 

Dados el potencial impoctante de engafto y las 
impticaciones para la validez de sus datos, (os 
prolesionales de la salud mental deben desarro- 
llar un umbral bajo de sospecha de las respues- 
tas engartosas Al rnismo tiempo. debido a que 
la etiqueta de “stinulador" puede tener un peso 
considerable en quienes toman las decisiones 
legales y tiene el potencial de empafiar todos los 
aspectos de la posicibn legal de la persona, las 
concluslones acerca de que una persona estd 
(ingiendo no deben alcanzarse de manera apre- 
surada (Melton y cols., 1998). 

El metodo mis comun y venerable para idcnti- 
ficar a clicntes dcshonestos es la entrevista clf- 
nica. No obstante, debe prcferirse un enfoque 
mis objetivo. La evaluation de la posible slmu- 
lacion a travis de la entrevista depcndc del 
juicio del clfnico (p. ej., “el cliente es inconsis- 
tente en su presentation de los sfntomas y pa- 
recc descoso de cstar enfermo, de modo que 
concluyo que esti simulando”), el cual puede 
resultar errOneo. En contraste, un enfoque ob¬ 
jetivo proporciona datos normativos, tasas de 
acierto y similares para la valoraciOn. Esto no 


sOlo podrta mejorar la precision de la evalua¬ 
tion, ademis, un enfoque mis estandarizado 
deberfa encontrar mayor accptabilidad en mu- 
chos sistemas judiciales. 

Por desgracia, cxistcn relativamente pocos 
enfoques objeti vos para la evaluation de la simu¬ 
lation en clientes forenses. Un instrument!) 
prometedor es la Structured Interview of 
Reported Syntoms, SIRS (Entrevista Estructu- 
rada de Sfntomas Reportados), un inventario 
de entrevista con 172 reach vos disenadodc ma¬ 
nera expresa para la valoraciOn de la simula¬ 
tion (Rogers, Bagby y Dickens, 1992). El 
enfoque que se incorpora en la SIRS sc basO 
en las estrategias identificadas en la litcratura 
clfnica como potencialmente utiles para dctec- 
tar la simulaciOn. Con el empleo de un mitodo 
de entrevista estructurada, dsta se evaltia en 
ocho escalas principales: 

• Sfntomas raros (informc cxcesivo de sfnto¬ 
mas poco frecuentes). 

• Combinaciones de sfntomas (sfntomas psiquii- 
tricos reales que raramentc ocurrcn juntos). 

• Sfntomas improbables o absurdos (los sfnto¬ 
mas revelan una cualidad fantistica). 

• Sfntomas flagrantes (alusiOn excesiva a sig- 
nos obvios de traslorno mental). 

• Sfntomas sutiles (alusiOn excesiva a proble- 
mas cotidianos). 

• Gravedad de los sfntomas (los sfntomas se 
expresan con una gravedad extrema, inso- 
portable). 

• Selectividad de los sfntomas (alusiOn indiscri- 
minada a problemas psiquiitricos). 

• Sfntomas informados contra observados (com- 

paracion de los sfntomas observados e in¬ 
formados). 

Ademis de las ocho escalas primarias, se ulili- 
zan cinco complementarias para interpretar es- 
tilos de rcspucsta. De las 172 preguntas. 32 son 
interrogacioncs repetidas para detectar incon- 
sistencia en las respuestas. Ejcmplos de estos 
tipos de preguntas de entrevista estructurada 
incluyen: "^en alguna ocasiOn ha sentido como 
si las tapaduras de sus dientes pudieran captar 
mensajes de la radio?" (sfntomas raros); “£tie- 
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fie fucrtcs dolores de cabcza al mismo tiempo 
que teme a los microbios?" (combinaciones de 
sfntomas); “£el mobiliario del sitio dondc vive 
parecc hacerse mis grande o mis pcqueno de 
un dfa para otro?” (sfntomas improbables o 
absurdos): “^licnc graves problemas con pen- 
samientos acerca del suicidio?" (Sfntomas fla- 
grantes). La escala requicre menos de una hora 
para su aplicacidn. 

Los resultados permiten la clasificacidn 
de las personas examinadas en las categorfas de 
engano dcfmitivo, probable engario y honcsti- 
dad. La confiabilidad del instrument es buena, 
con coeficicntes de confiabilidad de consisten- 
cia interna que van de .66 a .92. Los estimados 
de confiabilidad internalificadores son espldn- 
didos, con un rango desdc .89 a 1.00. 

Aunque la validez de la SIRS puede anali- 
zarse en las Ifneas familiares de contenido, re- 
lacionada con cl critcrio y de constructo (y la 
prueba tiene un buen desempeno en estas ireas), 
la verdadera medida dc su utilidad clfnica tiene 
que ver con la capacidad de la prueba para 
discriminar a los simuiadores conocidos o pre¬ 
sumes de los pacientes psiquiitricos y de los 
controles normalcs. Un estudio recientc indica 
que la prueba tiene un desempeno adccuado en 
este sentido (Gothard, Viglione. Meloy y 
Sherman. 1996). En una muestra combinada 
de 125 varones canalizados para valoracidn dc 
competencia (que incluyd a 30 personas a las 
que se les pidid que Fingieran simulacidn, sietc 
individuos de los que cxistfa una fuerte sospe- 
cha de simulacidn y 88 personas para las cua- 
les dsta pareefa poco probable), la SIRS tuvo 
una precisidn general de 97.8% en la clasifica- 
ciin de los participantes en las categorfas de 
simulacidn o no simulacidn. 

Otros estudios revelan resultados promete- 
dores. pero en ellos han participado principal- 
men te muestras de personas dc raza blanca y 
educadas (Rogers, Gillis, Dickens y Bagby, 1991; 
Rogers. Kropp. Bagby y Dickens. 1992). En 
contraste, la poblacidn del sislema de justicia 
criminal —el irea en la que es mis probable 
<iue se emplee la SIRS— es relativamente poco 
educada y existe una rcprescntacidn excesiva 
de minorfas. En un estimado, mis de 80% dc la 


poblacidn urbana en circeles en EUA es afrocs- 
tadounidense (Dixon, 1995). Todavfa no se ha 
respondido que tan bien funcionari la SIRS en 
la delcccidn de la simulacidn en esta 
subpoblacidn de tamafio considerable. 

) j EVALUACION Da ESTADO 
1 $ MENTAL PARA LA DEFENSA 
DE INSANIA 


En los juicios criminales, el acusado puede in- 
vocar una variedad de defensas que incluycn la 
incitacidn al dclito, capacidad disminuida (p. 
cj., por subnormalidad mental), automatismo 
(p. cj., por sugestidn hipndtica) y la defensa de 
insania. Cada vez que se invoca una defensa 
especial, se requicre una valoracidn del acusa¬ 
do en cuanto a su estado mental al momento 
dc comcter el dclito (MSO). En algunos tribu¬ 
nals, un psicdlogo csti calificado para ofrecer 
opiniones acerca del MSO dc un acusado. En 
este caso se restringe el anilisis a la defensa dc 
insania, dado que es la doctrina mis comun que 
darfa lugar a la necesidad dc una valoracidn del 
MSO. 

Casi todos estamos familiarizados con la 
defensa de insania, pero s6lo algunas personas 
excepcionales comprendcn sus disposiciones. 
En tdrminos tecnicos, la defensa de insania se 
conoce como no culpable a causa de insania 
(NCCI). Con base en algunos juicios scnsacio- 
nalistas y ampliamente publicitados, como el 
caso de John Hinckley quien intentd asesinar 
al presidente Ronald Reagan, en general el pu¬ 
blico lego ha concluido que los abogados cfni- 
cos emplean a menudo la defensa dc insania 
para ayudar a sus clientes a evadir la respon- 
sabilidad de sus espantosos erfmenes. Nada 
podrfa estar mis lejano de la verdad. En reali¬ 
dad, el alegato de NCCI es muy respetado por 
los expertos en jurisprudence, y se Ic invoca 
en menos de 1 de cada 1 000 procesos (Blau, 
1984); y en esta minima fracci6n de todos los 
casos criminales, la defensa tiene dxito en me¬ 
nos dc una ocasidn de cada cuairo (Melton y 
cols., 1998). La extendida crcencia de que las 






456 • Evaluation psicologica: Historia, principios y aplicationes 


(Capftulo IQ) 


personas para las que sc dictaraina NCCI sim- 
plcmente "sc van” sin pagar sus crfmencs, tam- 
bidn es imprecisa: la mayoria rccibc tratamiento 
hospitalario que dura varios anos. Sus tasas dc 
rcincidencia son quizds inferiores (y segura- 
mente no mayorcs) que las de los delincuentes 
convictos por ofensas similares (Melton el al., 
1998). Aunquc ilegal cn algunos estados, la de- 
fensa de insania ha mostrado una elasticidad 
notable —probablementc debido a que desem- 
pena una funcibn deseable en una sociedad mo- 
dema y compasiva. 

Varias pruebas legates dc cste lipo han tenido 
una influencia significativa en EUA, incluyen- 
do la regia M'Naughten, la regia de Durham, la 
regia del Cbdigo Penal Modelo y el veredicto de 
Culpable, Pero Menlalmente Enfermo (CPME); 
(Wrightsman y cols., 1994). Algunas jurisdic- 
ciones incluyen el impulso irresistible como 
complcmcnto dc la Regia M'Naughten. Algu¬ 
nos estados han abolido por complete la defen- 
sa de insania. Aquf se analizardn de manera 
breve las diferentes normas antes de comcntar 
la funcibn de las pruebas psicolbgicas en la 
dctcrminacibn de la insania legal. 

La regia M’Naughten es la mds antigua y 
se deriva de un caso ocurrido en Inglalerra en 
1843. Daniel M’Naughten estaba asediado por 
delirios paranoides acerca dc que cl primer mi- 
nistro, Robert Peel, era parte de una conjura cn 
su contra. M’Naughten acosb al primer minis- 
tro y cn un caso de confusibn de identidad le 
disparb a su secretario en la casa del No. 10 de 
la Calle Downing. A M’Naughten se le encon- 
trb no culpable a causa dc insania, un veredicto 
que disparb cl furor nacional. En rcspucsta a 
csta irritation, la reina Victoria le ordenb a los 
IS jueces superiores de Inglaterra que apare- 
cieran en la Camara de los Lores y aclararan 
las recibn creadas pautas sobre insania. La re¬ 
gia M’Naughten establecc que: 

En todos los casos se le debe Inlormar al jurado 
que todo hombre se supone cuordo y que posee 
et suliciente grado de raz6n como para ser res- 
ponsaUe de sus erfmenes, hasta que se pruebe 
lo contrarlo a la satislaccidn de dicho jurado: y 
que para establecer una defense fundamenlada 


en la Insania debe probarse con toda daridad 
que, al momento de cometer el acto, el ncusado 
se encontraba bajo tal defecto de razbn, por en- 
ferrnedad mental, que no conocla la naturaleza y 
calidad del acto que cometia; o, de conocerlo, 
no sabta que lo que estaba haciendo era inco- 
rrecto (cllado en Wrightsman el al., 1994). 

Asf, la regia M'Naughten "excusa" la conduc- 
ta criminal si el acusado, como consccuencia 
dc una “enfermedad mental", no sabfa lo que 
estaba haciendo (p. ej., un individuo esquizo- 
frbnico paranoide que haya crefdo que le dis- 
paraba al mismo diablo) o que no sabia que lo 
que estaba haciendo era incorrccto (p. ej., una 
persona con rctraso mental que haya crefdo que 
era aceptable dispararlc a un mendigo fastidio- 
so). Aproximadamente la mitad de los estados 
de EUA utilizan la Regia M'Naughten. 

Algunas jurisdiccioncs accptan el "impul¬ 
so irresistible” como complemento de la regia 
M'Naughten. En general, se define como una 
respuesta conductual tan fuerte que el acusado 
no pudo resistirla a travds dc voluntad o razbn. 
Pero /.cudndo puede considerarse que un impul¬ 
so es irresistible en oposicibn a simplemente 
no resistido? Esto ha resultado diffcil de defi- 
nir. Por obvias razones, los expertos legates no 
esldn nada felices con el concepto de impulso 
irresistible y en la actualidad se desvanece su 
utilizacibn como parte del alegato de insania. 

La regia dc Durham se formulb en 1954 
en el Tribunal de Apelaciones del Distrito dc 
Columbia en el caso de Durham contra EUA. 
Insatisfecho con la regia M’Naughten, el juez 
David Bazelon propuso una nueva prueba, co- 
nocida como la regia dc Durham, que regula la 
defensa de insania si el acto criminal fue 
“producto” de enfermedad o defecto mental. 
El propbsito de la esta regia era darle a los pro- 
fesionales de la salud mental mayor amplitud 
para presentar la informacibn pertinente a la 
responsabilidad del acusado. Los eruditos le¬ 
gates le dicron la bienvenida a csta regia como 
un gran avance, pero en 1972 el mismo distrito 
judicial que la habfa formulado la eliminb. 

La regia del Cbdigo Penal Modelo, pro- 
pucsta por el Colegio de Abogados de EUA. 
rccmplazb a la regia de Durham. Adoptada en 
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1972, la regia del Codigo Penal Modelo es la 
siguiente: 

Una persona no es responsable de conducts cri¬ 
minal si en el momenlo de presentar la conduc- 
la, y como resullado de enlermedad o deleclo 
mental, carece de la capacidad sustandal ya sea 
para apreciar la criminalidad [Incorreccibn] de su 
conducts o para someter su conducta a k>s re¬ 
quisites de la ley (citado en Mellon el al., 1998). 

Esta regia tambicn contiene disposiciones que 
prohiben la inclusidn de la psicopatfa o de la 
personalidad antisocial dentro de la defensa de 
insania. 

La regia del Codigo Penal Modelo dificrc 
de la M'Naughten en Ires sentidos importantes: 

1. Al ulilizarel tbrmino apreciar, reconoce los 
determinantes emocionales del acto criminal. 

2. No requiere de una carencia total de recono- 
cimicnto de parte de los dclincuentes en 
cuanto a la naturalcza de su conducta —s6lo 
una falta de “capacidad sustancial”. 

3. Incluye tanto un elemento cognitivo como 
uno volitivo, lo cual hace que la incapaci- 
dad de los acusados para controlar sus actos 
sea un criterio independiente para la insania 
(Wrightsman el al., 1994). 

Cerca de 20 estados en EUA siguen ahora la 
regia del C6digo Penal Modelo o ligeras varia- 
cioncs de la misma. 

Un avance rccientc cn cl alcgato de insa¬ 
nia es el veredicto de Culpable, Pcro 
Mentalmcntc Enfermo (CPME). Aproxima- 
damente una cuarta parte de los estados le per- 
miten a los jurados llcgar a un veredicto de 
CPME en casos donde el acusado alega insa¬ 
nia. Por lo comun, en estos estados el juez 
instruyc al jurado a entregar uno de los siguien- 
tes cuatro veredictos: 

• culpable del delito 

• inocente del delito 

• no culpable a causa de insania 

• culpable, pero mentalmcntc enfermo 

La intcncidn de la ultima altcmativa es que un 
acusado que se encuenlra CPME deberfa reci- 


bir el mismo fallo condenatorio que si se le hu- 
biera encontrado culpable del delito, pero debc 
comen/.ar su sentcncia en un hospital psiquid- 
trico. Despuds de la conclusidn del tratamien- 
to, cl acusado cumple con la parte restanle de 
su condena en una prisidn. 

Pero la intcncidn del veredicto de CPME y 
su realidad son dos cosas diferentes. El apoyo 
inicial para cstc veredicto como variante hu- 
manitaria del alcgato de insania se ha desva- 
necido en ahos recicntes. Wrightsman et al. 
(1994) senalan que los jurados expresan 
confusidn cuando se les pide hacer la diffcil 
d is tine ion entre enfermedad mental que results 
en insania (CPME) y aquellu que no results cn 
ello. Melton elal. (1998) encuentran pocas vir- 
tudes en el veredicto: 

... el veredicto de CPME es conceptualmente 
equivoco, tiene un potencial signiticatlvo para 
enganar a la persona que trata de descubrlr los 
hechos y no parece lograr su meta de reducir las 
exoneraclones por Insania o prolongar et confi- 
namiente de los dellncuenles que ostbn mental- 
mente enlermos y son peligrosos. La unica meta 
que puede lograr es aliviar la ansiedad de jura¬ 
dos y jueces que de otra manera tendrfan dificul- 
tad para docklir entre un veredicto do culpabili- 
dad y uno de inocencia a causa de insania. Es 
dudoso que esta meta sea apropiada o digna de 
alabanza (p. 215). 

Los estudios empfricos indican que los delin- 
cuentes con un veredicto de CPME pocas ve- 
ces recibcn tratamiento adecuado. Lo que es 
mds, es posible que reciban condenas mas du- 
ras que otros delincuentes a los que s61o se les 
cncontrd culpablcs (Callahan, McGreevy, 
Cirincione y Steadman, 1992). ;De hecho, al- 
gunos acusados dcclarados CPME han sido 
sentenciados a morir! 

Ahora que se ha introducido al lector a las 
varicdadcs del alegato de insania, es posible 
revisar la funcidn del psicdlogo cn la determi- 
nacidn de la insania legal. Un punto importan- 
te es que los psicdlogos tienen toda la razdn de 
ser cautos cn ofreccr su opinion basada cn una 
entrevista acerca del estado mental de una per¬ 
sona al momento de come ter un acto delicti vo. 
Despuds de todo, por lo comun, un delito ha 
ocurrido dtas, meses o incluso ahos antes, y es 
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posiblc que cl clienle no sea capaz de ayudar en 
la reconstruccidn prccisa de los acontecimien- 
tos y estados mentalcs. En consccucncia, el 
teslimonio psicoldgico acerca de la insania le¬ 
gal debe scr cauto y conservador. Los estudios 
dc confiabilidad acerca dc las valoraciones so- 
bre insania tambitSn sugicren que es apropiada 
la prccaucidn. En una resena de siete estudios, 
Melton el al. (1998) deierminaron que la con¬ 
cordance intercalificadores (en cuanto a si un 
acusado sufria insania legal) iban desdc un ni- 
vel bajo dc 64% (entre los psiquiatras dc la acu- 
sacidn y de la defensa) hasta un nivel elevado 
de 97% (entre psicdlogos con entrenamiento 
forense que utilizaban los instruments 
estructurados que se analizan despuds). 

A pesar de la conlrovcrsia sobre la funcidn 
dc los psicdlogos en la detcrminacidn del MSO, 
algunos expertos prcdiccn un mayor papel de la 
evaluation psicolOgica en casos que impiican el 
alegato de insania. En particular, las evaluacio- 
nes neuropsicolOgicas pueden proporcionar da- 
tos objettvos y vdlidos que ayuden a los tribunales 
a decidir los mdritos dc una defensa dc insania. 
Las recientes resoluciones de los tribunales afir- 
man que las conclusiones dc una prueba neuro- 
psicolOgica pueden utilizarse para mostrar que 
un acusado ticnc un dctcrioro en su capacidad 
para clegir lo correclo y abstenerse de lo incorrec- 
to(Blau, 1984; Heilbrun, 1992). Martell (1992) 
ha analizado la importancia de la evaluaciOn 
neuropsicoldgica para el alegato de insania, 
como lo define el Codigo Penal Modelo, el cual 
define al acusado como no culpable a causa dc 
insania si “carece de capacidad sustancial" para 
apreciar la criminalidad de su conducta. Los 
resultados de pruebas neuropsicolOgicas tienen 
importancia directa para esta cuestion. 

Las escalas de calificacidn como las Esca- 
las Rogers dc EvaluaciOn dc la Responsabili- 
dad Criminal (R-CRAS) pueden proporcionar 
tambidn una base util para valorar la responsa- 
bilidad criminal (Rogers. 1984, 1986). El exa- 
minador llcna las R-CRAS inmediatamente 
despuds de revisar los registros clfnicos, infor¬ 
mes dc investigacidn policiaca y la entrevista 
clfnica final con el pacicnte-acusado. El instru¬ 
ment© consiste en criterios descriptivos claros 


para 25 reactivos que evaluan (anto factores 
psicoldgicos como situacionales. Esos se cali- 
fican con rcspecto al momento del dclilo en cin- 
co escalas que miden las siguientes variables: 

• Confiabilidad del pacicnte 

• Organicidad 

• Psicopatologfa 

• Control cognitivo 

• Control conductual 

Los reactivos individuates en las R-CRAS sc 
obtuvieron de la norma dc insania del C6digo 
Penal Modelo (cuadro 10-10). Las confiabilida- 
dcs intercalificadores para las escalas R-CRAS 
van desdc .48 (para una subeseala de Simula- 
ci6n) hasta 1.00 (para Oiganicidad). La validez 
de constmcto se cstablecid al comparar la dispo- 
sicidn tomada en 93 casos legales con los datos 
dc las R-CRAS. Aunquc al rcsultado legal lo 
determinan muchas variables ademris del cstado 
psicoldgico de la persona al momento dc come¬ 
ter el delito, hubo 95% de concordancia en la 
determinacidn de cordura y 73% en la de insania. 

Aunquc los estudiosos reconoccn que las 
R-CRAS son prometedoras, aun existe cicrto 
escepticismo sano. Una preocupacidn es que las 
subcsculas del instrumento representan un ni¬ 
vel ordinal de mcdicidn, mientras que se im- 
plica la existencia de cuantificacidn al nivel de 
intervalo. Otra preocupacidn es que los auto- 
res de la prueba afirman “cuantificar areas de 
juicioquc tienen una naturaleza Idgica, intuitiva 
o ambas", lo cual conduce a un sentido falso de 
certidumbre cientffica (Melton el al., 1998). 
Con toda seguridad, las R-CRAS desempeiian 
una funcidn valiosa al ayudar a los clfnicos a 
organizar su pensamiento y valoracidn. La uti- 
lidad de la decisidn general —cuerdo contra 
insano— dcpendcra de investigacion adicional 
sobre validez (Howell y Richards. 1989). 


COMPETENOA PARA ESTAR 
m SUJETO A JUICIO 


La Sexta Enmienda de la Constitucidn de EUA, 
aprobada en 1791, garantiza que todo ciudadano 
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Cuadro 10-10. Reactivos de muestra 
de las R-CRAS 


10. Amnesia sobre el supuesto delito 

(Esto se refiere a la evaluacidn de amnesia 
por parte del examlnador, no necesariamente 
a aquella que informe el pacienle.) 

0) No existe intormacidn 

1) Ninguna: recuerda todo el acontecimiento 
con detalles considerables 

2) Ligera: de dudosa importancia. El padenle 
olvida detalles menores 

3) Love: el paciente recuerda la sustancia de 
lo que ocurrio, pero olvida muchos detalles 
menores 

4) Moderada: el paciente ha olvidado una parte 
importante del supuesto delito, pero recuerda 
suficientes detalles como para creer que ha 
sucedido 

5) Grave: El paciente sufre amnesia sobre la 
mayor parte del supuesto delito, pero recuer¬ 
da suficientes detalles como para creer que 
ha sucedido 

6) Extrema: el padente liene amnesia completa 
acerca de la totalidad del supuesto delito 

tl. Dolirios al momento de ocurrir el supuesto 
delito 

1) No existe informacibn 

2) Sospecha de delirios (p. ej„ sustentado s6lo 
en un autoinforme cuestionable). 

3) Delirios confirmados, pero en realidad no 
relacionados con la comisidn del supuesto 
delito 

4) Delirios confirmados que contribuyeron al 
supuesto delito, pero que no constituyeron 
una fuerza predominante sobre la comisidn 
del mismo 

5) Delirios controladores confirmados, con base 
en los cuales se cometid el supuesto delito 


Fuenie: Adaptado y repioducido con aulonzaaOn especial de la 
editorial. Psychological Assessment Resources. Inc . Odessa. FL 
33556. de Rogers' Criminal ResponsabHity Assessment Scales 
de Richard Rogers. Ph D Copyright 1984 de PAR, Inc Seprohfbe 
mayor reprodocciOn sin aulorizaciOn de PAR, Inc 

acusado ticne cl dcrecho a un juicio impar- 
cial, expedito y publico con el beneficio de una 
defcnsa. Si por cualquier razdn, el acusado es 
incapaz dc ejercer cstos dcrcchos constitucio- 


nales, cntonccs no puede llevarsc a cabo un 
juicio apropiado. En tdrminos especfftcos, si el 
acusado tiene un defecto, cnfcrmcdad o padc- 
cimiento mcntalcs que lo haccn incapaz dc com- 
prender cl proceso o de ayudar en su propia 
defcnsa, entonccs se considera que dste es in- 
competente para estar sujeto a juicio. La Su- 
prema Corte de EUA conftrmd esta norma en 
el caso dc Dusky contra EUA (1960) como 
“...si [cl acusado] tiene la suficiente capacidad 
en cl momento como para consultar con su abo- 
gado con un grado razonable dc comprcnsidn 
racional —y si tiene tanto una comprensidn ra- 
cional como objetiva acerca de las diligencias 
que se siguen en su contra". En la prdctica, la 
competencin para estar sujeto a juicio se re- 
fterc a cuatro elementos y distinciones (Melton 
el al., 1998): 

1. La capacidad del acusado para comprendcr 
el proceso criminal, incluyendo cl papel dc 
los participantcs en ese proceso. 

2. La capacidad del acusado para funcionar en 
ese proceso, principalmente al ayudar a sus 
abogados en la preparacidn dc una defensa. 

3. La capacidad del acusado, al contrario de su 
disposici6n, para comunicarse con sus abo¬ 
gados y comprender los trdmites. 

4. El grado razonable de comprcnsidn de parte 
del acusado, en contraposicidn a una com- 
prensidn perfecta o completa. 

La mayor parte de los tribunales en EUA siguc 
esta norma que enfatiza el funcionamiento ac¬ 
tual del acusado. 

El juez que preside el caso puede solicitar 
una valoracidn psicoldgica o psiquiAtrica para 
ayudar a determinar la competencia del acusa¬ 
do para someterse a juicio. Un informe recien- 
tc indica que cada aiio se realizan en EUA mils 
de 25 000 valoraciones de competencia para 
estar sujeto a juicio (McDonald. Nussbaum y 
Bagby. 1992). Es importante enfatizar que los 
psicdlogos, psiquiatras y otros profcsionalcs dc 
la salud mental s6)o prestan ayuda en una au- 
dicncia dc competencia al presentar sus opinio- 
ncs expertas. S61o el juez tiene el podcr dc tomar 
una dcterminacidn de competencia. Aunque 
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no existe un formate estandar para dicha deter¬ 
mination. la mayorfa de los jucccs solicitan que 
el psicdlogo tome en consideracibn la mayor 
parte o los 11 factores que sc citan cn el cuadro 
10 - 11 . 

La incompetencia para cstarsujeto a juicio 
cs algo totalmentc independiente de la insania 
legal; cstas dos cuestiones se juzgan con base 
en normas absolutamente diferentes. La insania 
legal ticne que vcrcon cl momento de la comi- 
sidn del acto delicti vo, mientras la incompctcn- 
cia implica una situation continua y actual; lo 
que es mds, esta ultima no es sinbnimo de en- 
fermedad mental, aunque las dos pueden ocurrir 
al mismo tiempo. En caso de que cl juez esta- 


Cuadro 10-11. Factores considerados 
en la determinaciOn de la competencia 
para estar sujeto a juicio 


1. Compresion del acusado acerca de los cargos 

2. ComprensiOn del acusado acerca de la natu- 
raleza y amplitud de penas 

3. Entendimienlo del acusado acerca de la na- 
luraleza del sistema de contrarios en el pro- 
ceso legal 

4. Capacidad del acusado para revelarle al abo- 
gado los hechos pertinenles que rodean a la 
supuesla ofensa 

5. Capacidad del acusado para relacionarse con 
el abogado 

6. Capacidad del acusado para ayudar al aboga¬ 
do en la planilicacidn de la defensa 

7. Capacidad del acusado para desafiar de ma- 
nera realista a los testigos de la acusaclOn 

8. Capacidad del acusado para manilestar un 
compodamiento apropiado en el tribunal 

9. Capacidad del acusado para atestiguar de 
manera pertinente 

10. MolivaciOn del acusado para ayudarse a s( 
mismo en el proceso legal 

11. Capacidad del acusado para enfrentarse con 
el estres del encarcelamiento previo al juicio 


Fuenl*: Florida Rules ol Criminal Procedure, ciladas en 
Wrighlsman,LS,NieUei,MT.yFortune. W H.(1994) Psycho¬ 
logy and the legal system (3a ed) Pacific Grove, CA Brooks/ 
Cole 


blezca que el acusado es incompctente, el jui¬ 
cio sc pospone, cn general, por un periodo 
de seis meses aproximadamente. En algunos 
casos, a las personas consideradas incompctcn- 
tes sc les interna en una instituciOn mental para 
un tratamiento que ticne el propOsito de restau- 
rar su competencia, a fin de que despuds sc 
pueda llevar a cabo un juicio. Los individuos 
acusados de dclitos menos graves pueden reci- 
bir tratamiento como pacientcs extemos. 

Ademas de la information obtenida en la 
entrevista clfnica, los resultados de pruebas psi- 
colOgicas son componentes importantes de una 
valoraciOn dc competencia. Por cjcmplo, un Cl 
bajo puedc tonstituir evidentia de incompeten¬ 
cia ante los ojos del tribunal. Aunque no exislen 
pautas firmcs, la mayor parte dc los tribunalcs 
determinan que las personas con un deficit in- 
tclcctual significativo —digamos un Cl cn cl 
rango de retraso moderado o rods bajo— son 
incompetentes para estar sujeto a juicio. Dc la 
misma manera, un patrOn de resultados de prue- 
ba que indiquen una dcficicncia ncuropsicolO- 
gica grave puede justificar una conclusion dc 
incompetencia legal, aunque el Cl del cliente 
sc cncuenlre dentro del rango normal. Por cjcm¬ 
plo, un acusado que sufre dc deficicncias gra¬ 
ves dc comprensiOn del lenguajc a causa dc una 
embolia, puede considcrarse incompetcnte 
para estar sujeto a juicio. 

Sc encuentran disponibles varias pruebas 
y procedi mientos formalcs dc dclecciOn que tic- 
nen la funciOn de ayudar en la valoraciOn de 
competencia. Estos instrumenlos sc resumen 
en el cuadro 10-12. Aquf se centra la atenciOn cn 
la Competency Screening Test, CST (Instrumen- 
to de EvaluaciOn de la Competencia), que pro- 
bablcmcnte es la de mds uso como auxiliar cn 
la valoraciOn dc competencia. 

Lipsitt, Lelos y McGarry (1971) desarro- 
llaron la CST en un intento por formalizar la 
valoraciOn dc competencia. La CST consistc en 
22 frases incomplctas que sc ccntran cn los trd- 
mites del tribunal, relaciones abogado-cliente 
y procesos dc pensamiento del acusado (fi- 
gura 10-2). Cada respucsta se califica con 0 
(dcficiente), 1 (limttrofe pero no claramente 
apropiado) o 2 (claramente apropiado), segun 
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Cuadro 10-12. Instrumentos de 
evaluacion de competencia 


Competency Screening Test (Instrumento de 
Evaluaclbn de la Competencia) 

(Lipsltt, Lelos y McGarry, 1971) 

La CST es una prueba de complelacion de ora- 
clones con 22 reactivos que liene una gula objetiva 
de calif icacion. Algunos comentaristas consideran 
que los criterios de califlcacibn son vagos y tam- 
bien se quejan de que la prueba liene una defiden- 
le validez aparente y dbbil validez de contenido. 

Competency Assessment Instrument 
(Laboratory for Community Psychiatry, 1974) 
El CAI es una entrevista eslructurada de 13 luncio- 
nes relacionadas con el funcionamiento compe- 
lenle en un juicio. Una preocupacibn es que los 
examinadores emplean dilerentes enloques para 
aplicar la escala. 

Interdisciplinary Fitness Interview (Entrevista 
Interdlsciplinaria de aptitud) 

(Golding, Roesch y Schrciber, 1984) 

La IFI es una entrevista semiestructurada del acu- 
sado en cinco Areas legales y 11 categories de psi- 
copatologta. En tbrminos Ideates, el abogado del 
acusado debe eslar presenle durante la aplicacibn. 

Fitness Interview Test (Prueba de Entrevista 
de Aptitud) 

(McDonald, Nussbaum y Bagby, 1992) 

La FIT es una clasilicacibn semiestructurada del 
acusado en cuanto a 24 aspectos legales y 14 
Areas psiquiblricas. La FIT revela excelente con- 
fiabilidad intercalificadores y discrimina bien entre 
grupos do acusados clasificados como aptos o 
no para estar sujetos a juicio. Todavfa estb pen- 
(fiente su revision y se aconseja precaucibn en el 
empleo de la escala. 

Georgia Court Competency Test -Revised 
(Prueba de Competencia del Tribunal de 
Georgia -Revlsada) 

(Johnson y Mullett, 1987) 

La GCCT-R es una prueba oral con 21 reactivos 
sobre comprensibn de los procedimientos en un 
tribunal, conocimiento del cargo, conocimiento de 
•as posibles penas y capacidad para comunicarse 
de manera racional. Algunos revisores advierten 
que la prueba toma una mueslra Inadecuada del 
dominio de las capacidades relacionadas con la 
competencia. 


muestras dc normas de calificacibn. En un estu- 
dio dc validacibn cruzada basado en 50 rcsi- 
dentes varoncs dc una unidad estatul forense, 
la CST predijo de manera correcta 82% de las 
recomendacioncs de competencia presenta- 
das por el equipo forense encargado dc deter- 
minar la competencia o incompctencia legal. 
Se encontrb que la CST estimaba de manera 
precisa la competencia, pero pronosticaba en 
exceso la incompctencia (Nottingham y Mattson, 
1981). En general, la CST c instrumentos simi- 
larcs son utiles al inicio dc una valoracibn de 
competencia, pero no deben constituir el unico 
medio de evaluacibn. Otras pruebas dc compe¬ 
tencia se revisan en Bagby, Nicholson, Rogers 
y Nussbaum (1992); Melton et al. (1998) y 
Nicholson, Robertson, Johnson y Jensen 
(1988). 

Una grave prcocupacibn en las valoracio- 
ncs de competencia es si el cliente estb simu- 
lando. Despubs dc todo, demorar la fccha del 
juicio durante un largo tiempo proporciona un 
motivo fuertc para parccer incompetentc. Los 
clfnicos tienen una variedad de mbtodos y prue¬ 
bas (descritos antcriormentc) para identificar a 
clicntcs que podrfan estar simulando; aun asf, 
el proceso para la valoracibn dc competencia 
no es inmune, como lo indican casos tan sona- 
dos como cl del hombre de Connecticut que 
evadib una acusacibn por asesinato (Prensa 
Asociada, 30 dc junio dc 1998). Prcsuntamen- 
te, este individuo habfa asesinado a su novia 
anterior y al novio actual de bsta con una pisto- 
la, para despubs dispararsc en la cabeza. Sufrib 
dano cerebral y parblisis parcial, y cuatro psi- 
quiatras lo declararon incompctente para estar 
sujelo a juicio en cuatro audiencias separadas. 
Los psiquiatras afirmaron que era incapaz de 
comunicarse dc manera efectiva con su aboga¬ 
do. Se anulb una orden de la cortc que requerfa 
que este hombre se sometiera a valoracioncs 
anuales de competencia, lo cual permitib que 
se le pasara por alto y quedara libre. Nueve afios 
despubs se le encontrb asistiendo a una univer- 
sidad como estudiantc dc los cursos de pre- 
paracibn para la carrera de mcdicina y con 
un promedio de calificaciones entre 8 y 9. Ejem- 
plos como este constituyen una razbn para 
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1 El abogado le dijo a Bill que_ 

2 Cuando vaya al tribunal, el abogado habr6 da_ 

3 Jack sintto que el |uez__ 

4 Cuando acusaion a Prill do un dellto, 61 _.—.— 

5 Cuando me prepare a ir al tribunal con ml abogado _ 

6 Si el |urado me encuentra culpable, yo __ 

7 , La manera en que se decide un jwdo_ 

8. Cuando se presenk) al |urado la evidence del caso de George_ 

9 Cuando el abugado interrogd a su cllcnlo en el tribunal, 6ste dijo_ 

10 SI Jack luviera que presenlar su propio caso, 61_ 

11 Cada vez que el fiscal de dlstrito me hacla una pregunla. yo _ 

12 Mientras escucriaba a los tesligos atestiguar on mi contra, yo_ 

13. Cuando el lestigo en contra de Harry <*o evldencia lalsa, 61_ 

14 Cuando Bob no estuvo de acuerdo con su abogado delensor, 61_ 

15. Cuando se me acusd tormalmente del dolilo, pensd para ml_ 

16. SI el abogado de Ed le sugiere que se declare culpable. 61 _ 

17. Lo que m4s le preocupa a Fred acerca de su abogado__ 

18. Cuando dicen que un hombte es Inocente hasta que se pruebo lo contrano _ 

19. Cuando pienso en que me envle a prisidn, yo__ 

20 Cuando Pha pwnsa en aquelio por lo que lo han acusado, 61_ 

21 Cuando el jurado escucrie ml caso, e»os habrdn de_ 

22. Si luviera oproturudad de hablar con el juez, yo __ 

2 Cuando vaya al tribunal, el abogado habrd de 

a) Criterio legal capacidad para cooperar, comunicarse y relacionarse con su delensor 

b) Criterio psicoldgico: capacidad para relacionarse o conhar. 

CalltlCAciOn 2: 

Ejempios "delonderme* 

"estar alii para ayudarme* 

nacer to mejor posible para obtener una sentencia leva' 

"representarme" 

“presentar mi caso" 

Callllcaclon 1: 

Ejempios "estar alir 

‘pedir que el juicio se posponga" 

■pedirme que declare* 

Calilicaclbn 0: 

Ejempios "encerrarme" 

"manlener la boca cerrada* 

"acusarme" 


Figure 10-2. Competency Screening Test (Instrumento da Evaluacibn de la Competencia). 

Fuonte: Ftelmpreso con autorizacidn de Llpsill, P D (1970), Competency Screening Test Boston Competency lo Stand Trial and 
Mental Illness Project 


mostrar humildad y cautcla cuando los psicd- 
logos abordan valoraciones de competencia.* 


• Otra explicacibn (dnica) c s que incluso las personas 
incompctcntes con dafio cerebral grave recibirin cali- 
ftcactoncs de 10 o9 si asisten a la universtdad. Quizi la 
inflacibn dc caJificaciones ha ido demasiado Icjos. 


1 PREDICCION DE LA VIOLENCIA 

j Y evaluaci6n del riesgo 

En ocasiones, los psicdlogos fungen como ase- 
sores durante la fase dc scntcncia de un juicio 
para determinar si un acusado convicto repre- 
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senia un pcligro para sus companeros en prisidn 
o para los miembros dc la comunidad. Esla 
informacidn pucdc ser fundamental para de- 
terminar la duracidn de una sentencia o la asig- 
nacion del acusado (p. ej., a centros dc seguri- 
dad minima, intermedia o maxima). Las 
decisiones sobre libertad condicional tambien 
pueden depender de una determinacidn dc pe- 
jigrosidad. En casos extremos, el testimonio cn 
una code de los profcsionales de la salud men¬ 
tal puede influir en una decisidn para invocar 
la pena dc muerte. 

Por desgracia, aunque muchos investiga- 
dores han intentado disenar medidas psicold- 
gicas dc la peligrosidad, no sc ha dcsarrollado 
ninguna prueba o procedimiento psicoldgico 
que proporcionc una prediccidn precisa y de 
largo alcance dc la violencia (Blau, 1984; 
Horowitz y Willging, 1984; Melton el al., 
1998). De hccho, ni siquiera cs posiblc con- 
firmar posteriormente, con cierto grado de 
precisidn, la conducta violcnta a partir s6lo 
de pruebas psicologicas. 

<,Por qud cs tan diffcil predecir con prccisidn 
la conducta violenta? Melton el al. (1998) ci- 
tan cuatro factores que contribuycn a este de- 
saffo: 

1. Variabilidad en la definicion legal. El re- 

sultado a predecir se define de diversas ma- 
ncras como violencia, riesgo o peligrosidad, 
y los criterios de pertinencia legal varfan de 
un ambientc a otro. Algunos estatutos requic- 
ren de pruebas dc un acto explfcito dentro 
dc un periodo particular, mientras otros po- 
drfan aceptar un juicio clfnico dc “tenden- 
cias explosivas" como prueba de violencia. 

2. Complejidad de la literatura. La literatura 
dc invesligacidn que examina la relacidn 
entre factores antecedcntes y rcincidencia en 
conducta violcnta es mucha; no obstante, es 
"tanto abrumadora como inconexa", de mo- 
do que incluso los profesionales mds escru- 
pulosos encucntran diffcil extracr algun 
significado de ella. 

3. Errores y parcialidad cn los juicios. Los 
profesionales de la salud mental est&n pro- 
pensos a cometer errores cognitivos sutiles 


cn sus valoraciones de los acusados. Por 
ejemplo, un problema cs la tendcncia a consi- 
derar a la peligrosidad unicamcnte como un 
rasgo cuando, de hecho, su aparicidn siem- 
pre cs producto de una interaccidn con fac¬ 
tores ambientalcs (p. ej., disponibilidad de 
un arma). Otro problema es que los clfnicos 
permiten que la noloricdad de un delito afec- 
tc de manera desproporcionada su juicio. 

4. Consecuencias polfticas para el profesio- 
nal. La prcdiccidn excesiva de violencia es 
mds segura para los clfnicos que la limitada. 
Si se libera a un acusado con base en la pre- 
diccidn de un clfnico y despuds dicho acu¬ 
sado comete un delito violento, el profesiona! 
es vulnerable a una accidn legal debido a li- 
bcracidn negligente. En los casos limftrofes, 
existc un incentivo muy podcroso para in- 
clinarse cn la direccidn de una conclusidn 
de “peligrosidad". 

Un estudio rccicntc dc Menzies, Webster. 
McMain, Staley y Scaglione (1994) ilustra las 
dificultadcs cn la prediccidn dc la conducta 
violenta. Estos investigadores utilizaron un 
Dangerous Behavior Rating Scheme, DBRS 
(Esquema de Calificacidn dc la Conducta Pcli- 
grosa) de 15 reactivos para predecir conducta 
violenta en un seguimiento a seis afios con 162 
acusados enviados a evaluacidn de pcligrosi- 
dad. El DBRS consistid en 15 reactivos, en una 
escala Likert de sietc puntos, que median atri- 
butos de la personalidad (p. ej., hostilidad, 
emocionalidad, capacidad de empatfa), facto¬ 
res ambientales (p. ej., apoyo, estrds), factores 
situacionales (p. ej., peligrosidad aumentada 
con uso de alcohol) y reactivos generates 
(p. ej., pcligro hacia otras personas cn cl pre¬ 
sente). Ademds, sc utilizd una variedad de indi¬ 
ces de prediccion basados en las califtcaciones 
de enfermeras, psiquiatras, trabajadores socia- 
les y otros profesionales para pronosticar una 
variedad de medidas dc resultado en intervalos 
que iban de 1 a 6 ahos. La mayor parte de las 
correlaciones se coloc6 en el orden de .2 y muy 
pocos elementos de predicci6n lograron Ilegar 
al Ifmitc superior de .40. La correlacidn mas 
alta fue de .53, pero tenfa que ver con el caso 
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restringido dc prediccibn de violcncia a corto 
pla/.o cn individuos hospitalizados en un pabe- 
llbn psiquidtrico. En general, los result ados fue- 
ron tan dcsalcntadorcs que los investigadores 
aconsejaron en contra "de la participacibn clf- 
nica o psicomblrica en la identificacibn de su- 
jetos potencialmente violcntos en anibientes 
clfnicos o corrcccionalcs”. 

Una inquictud particular cn la prediccibn 
de violencia cs la tasa muy elevada dc falsos 
positives que suele observarse cn estudios con- 
trolados. Esto significa que un numero impor- 
tante de personas para las que se predice 
violcncia posteriormenlc no revelan ninguna 
conducta de este tipo. Gardner, Lidz, Mulvey y 
Shaw (1996) Ic pidicron a clfnicos en una sala 
de urgencias psiquidtricas que califtcaran su 
preocupacibn (de 0, ninguna preocupacibn. a 
5, gran preocupacibn) acerca de que 784 pa- 
cicr.lcs sC vieran involucrados en aclos violcn¬ 
tos a lo largo de los siguientes seis meses. Se 
combinaron las calificacioncs del clfnico y del 
psiquiatra dc guardia (un total de 10 puntos 
posibles) para producir un cstimado mas esta- 
blc. Un total dc 327 pacientes recibieron pun- 
tuaciones totales dc 6 o mayores, lo cual indica 
un grado importantc dc preocupacibn clfnica. 
Dc estc grupo se encontr6 que j49% estaban 
complctamente libres de conducta violcnta du¬ 
rante los siguientes seis meses! Una fbrmula 
cstadfstica simple que utilizb informacibn so- 
bre antecedentcs rcsultb significativamente mds 
precisa en la rcalizacibn dc predicciones, pero 
aun asf produjo una tasa de 42% de falsos posi¬ 
tives. Ambos mbtodos —el clfnico y el cstadfs- 
tico— lambibn produjeron niveles altos de falsos 
negativos (pacientes dc los que no existfa sos- 
pccha dc violencia futura y que subsecuente- 
mente participaron en actos de ese tipo). 

Aunque la prediccibn de largo alcance 
sobre peligrosidad por medio de pruebas psi- 
colbgicas o escalas de calificacibn ha resultado 
diffcil, la cvaluacibn de corto alcance sobre el 
riesgo con delincuentes violcntos ha logrado un 
dxito moderado. Con un andlisis del historia! 
previo de los delincuentes violcntos. Hall (1987) 
ha demostrado que pueden utilizarse las siguien¬ 
tes variables para obtener una probabilidad dc 


violencia durante los Ires meses posteriores a 
la valoracibn forense: 

• Ocurrencia reciente del acto o actos violcn¬ 
tos antcriores. 

• Numero dc actos graves dc violencia ocurri- 
dos antes. 

• Abuso de sustancias en el curso del mes anterior; 

• Amenaza de rompimiento o rompimiento real 
de una rciacibn amorosa. 

• Problcmas laborales que conduccn a acci6n 
disciplinaria o despido. 

• Oportunidad para la violencia; por ejcmplo, 
acccso a una pistola. 

Al cuantificar los factores anteriorcs, cl exami- 
nador llcga a una probabilidad dc que la vio¬ 
lencia continue en el futuro a corto plazo (Hall, 
1987). Esta estrategia cs dtil principalmentccon 
personas evaluadas que lienen un historial de 
conducta violenta, de modo que ticne una 
aplicabilidad limitada cn el campo forense. No 
obstante, para cicrtos individuos que satisfaccn 
la mayor parte o todos los criterios listados antes, 
es mds frecuente que se lleguc a cone I us i ones 
correctas en la prediccibn de conducta violcn¬ 
ta. El enfoque que se destaca aquf demucslra 
una vcz mds el podcr dc los datos biogrdficos 
cn la prediccibn de la conducta. 

/•'• valoraci6n de custodia 

DE LOS NINOS EN EL DIVORCIO 


Es posible que las psicdlogos testifiquen cn las 
disputas sobre custodia infantil que surgen des¬ 
puds del divorcio. Dc hccho, dichas disputas 
son poco comunes —en el 90% dc los casos dc 
divorcio, ambos padres llegan a un acuerdo 
sobre las disposiciones de custodia, sin rccu- 
rrir a la intervencibn legal (Melton et al ., 1998). 
La luncibn del consultor consistc cn ofrccer opi- 
niones expertas sobre temas como idoneidad 
de los padres o intereses primordialcs del nino. 
En general, estas opiniones se basan cn evalua- 
ciones del nino (o ninos) y de ambos padres y 
puede incluir pruebas psicolbgicas. 
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Por desgracia, cn pocas ocasioncs cl testi¬ 
mony quc sc basa en pruebas psicoldgicas pro- 
porciona una base lilil para ayudar al juez a 
tomar la decisidn salomonica quc sc rcquiere 
cn una disputa dc custodia (Blau, 1984). La dc- 
bilidad esencial dc las pruebas psicologicas en 
estc contexto cs quc cl vinculo entre las con- 
clusiones de prueba y la patcrnidad eficaz es 
ddbil o no existe. La tecnica Rorschach y otras 
pruebas dc personal idad no se disenaron para 
evaluar la rclacidn dc los padres con sus hijos 
y, por tanto, son irrclcvantes en gran medida 
para las cuestiones reales quc aparccen en los 
casos de custodia infantil. 

Desgraciadamcntc, los clfnicos han sido 
lentos para darse cuenta de sus limitaciones en 
el Area forense en relacidn con las disputas de 
custodia infantil. Como resultado “proba- 
blemente no existe pregunta forense en la que 
los profesionales de la salud mental se hayan 
extralimitado de mancra tan comun y atroz" 
(Melton el al., 1998, p. 484). Es comprcnsible 
que los profesionales legales se muestren es- 
cdpticos acerca del valor del testimonio psico- 
Idgico en casos de custodia infantil. 

La American Psychological Association ha 
reconocido la tensi6n que existe entre la psico- 
logfa y el sistema legal al publicar las pautas 
para las valoraciones de custodia infantil en los 
trSmites de divorcio (APA, 1994a). Estas pau¬ 
tas se refieren a preocupaciones acerca del “mal 
uso de la inlluencia de los psicdlogos” en los 
trimites de custodia y ofrecen principios para 
la prictica en esta drea cada vez mis compieja. 
Las pautas especiftcan que los interescs primor- 
diales del nino son lo mds importante. Especi¬ 
ftcan ademds que sc rcquiere de entrenamiento 
espccializado, incluycndo familiaridad con las 
normas y proccdimientos legates aplicables y 
conocimiento dc las leyes que gobiernan el di¬ 
vorcio y la adjudicacidn de custodia en la juris- 
diccidn local. Las pautas tambiln dictan una 
complcta neutral idad de parte del psicdlogo: 

El psicOlogo. de manera equilibrada e imparclal, 
inlorma y aconseja a la corto y a los posibles 
custodios del nlrto acerca de los lactores pstco- 
Idglcos relevantes relaclonados con las cuestio¬ 
nes de custodia. El psicdlogo debe ser impar- 


cial, sin importer si lo ha contratado la corte o 
una de las partes dentro de los trAmites (APA, 
1994. p. 678). 

Esta ultima pauta tiene especial importancia 
para la profesidn, en vista de que promueve la 
dignidad en la prictica dc la psicologfa. Sin 
embargo, la imparcialidad es una cualidad difi- 
cil de mantener, en la medida en que surgen 
presiones sutiles cuando un abogado de una de 
las partes contrata los servicios de un psicdlo- 
go para la valoracidn dc custodia. 

En respuesta a la auscncia de una base de 
datos cientffica, se han propucsto varios instru- 
mentos cxpcrimcntales de evaluacidn para los 
procedimientos forenscs de custodia infantil, 
incluyendo escalas de calificacidn que inten- 
tan estimar cl potencial para la crianza infantil 
eficaz. Una dc tales pruebas es la Ackennan- 
Schoendorf Scales for Parent Evaluation of 
Custody (Escalas Ackerman-Schocndorf dc 
Valoracidn de los Padres para Custodia; 
Ackerman y Schoendorf, 1992). La ASPECT 
es, cn csencia, una baterfa de pruebas estdndar 
(Rorschach. MMPI-2, WAIS-R, WRAT-R para 
los padres y la Prueba del Dibujo de una Familia, 
la CAT y una medida de Cl para el nino) que se 
utilizan junto con cuestionarios de preguntas 
abiertas, entrevistas, observaciones y registros 
del tribunal (en caso necesario), como base de 
datos a partir de la cual el profesional llena un 
inventario dc 56 reactivos con respuestas de sf- 
no (se Henan inventarios independientes para 
el padre y la madre). Los resultados de los 56 
reactivos de sf-no producen tres subpun- 
tuacioncs y una calificacidn total, el fndice de 
Custtxlia Patema (ICP) para cada uno de los pa¬ 
dres. Todas las calificacioncs sc informan como 
puntuaciones T con media de 50 y desviacion 
estindar dc 10. El ICP tiene el propdsito de 
identificar cutil dc los padres es mis eficaz 
—y qu6 tanto. Una diferencia en puntuacidn 
T de 10 a 15 puntos se considera significaliva, 
de 16 a 20 puntos son muy significativas de 
mis de 20 puntos son notables. Cuando ambos 
padres tienen puntuaciones en el ICP superio- 
res a 60, sc considera probable que cualquiera 
de ellos serfa un progenitor eficaz. Si ninguno de 
ellos lo es (puntuaciones de 40 o menores). el 
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ICP liene cl propdsito de reflejar tambidn esa 
conclusidn. 

Para la puntuacidn total del ICP, la confia- 
bilidad inlercalificadorcs va dc .92 a .96 y se 
considera adecuada. Los dalos de confiabilidad 
para las tres subescalas, son: 

• Observacional, o la apariencia y presentacidn 
del progenitor 

• Social o dc interaccidn del progenitor con 
otras personas, incluyendo al nino 

• Cognitiva-emocional, o sobre cl funciona- 
miento psicoldgico y mental del progenitor 

Son sustancialmcntc mis ddbilcs, lo cual indi- 
ca que los profesionales deben depender s6lo 
de la punluacidn del ICP. Se utilizd una amplia 
muestra de cstandarizacidn (N = 200), pero cs- 
tas familias eran predominantemenlc de raza 
blanca (97%), dc modo que es posible que el 
ASPECT no sea apropiado para utilizarse con 
familias dc minorfas. 

La validez de la puntuacidn del ICP se eva- 
Iu6 al comparar las recomcndacioncs de la 
ASPECT con las decisiones de los jueces en 
casos de custodia. En aquellos casos donde 
existid una difercncia significati va entre las pun- 
tuaciones dc la ASPECT para la madre y el 
padre (10 puntos o mis), la prueba mostrd 93% 
de concordancia con las decisiones de los jue¬ 
ces. Aun asf, los revisores han recomendado 
precaucidn en el empleo de la ASPECT por 
varias razones. Una prcocupacidn cs la escasa 
investigacidn independiente en publicaciones 
de consults que se relacione con la validez del 
instrument. Melton (1995) scnala que cl eslu- 
dio de validacidn se basd en las mismas familias 
utilizadas para desarrollar el instrument, lo 
cual puede conducir a tasas infladas dc acier- 
to. Otra preocupacidn cs que no se ha demos- 
trado que algunos de los reactivos de la escala 
(p. ej., si cl Cl de uno de los padres es inferior 
en mis de cinco puntos al del nirlo; cuil de las 
padres se coloca junto a dste en su dibujo) indi- 
quen competencia del progenitor o resultado 
ra el nino en estudios sobre divorcio. Heinze 
Grisso (1996) concluyen que la ASPECT 
quiere dc mayores datos normativos, dc 


confiabilidad y de validez antes dc que los pro- 
fcsionalcs puedan colocar su confianza en la 
baterfa de cvaluacidn. 

Un problems con la ASPECT es cl gran 
tamaho de la baterfa completa, que incluye prue- 
bas extensas con ambos padres y con todos sus 
hijos, asf como entrevistas y analisis de abundan- 
tc (^excesiva?) informacidn de prueba. Quizi 
pudicra obtenerse el mismo tipo de informa¬ 
tion de evaiuacidn de un modo que consuma 
menos tiempo. tste es el enfoque que toman 
Gordon y Peek (1989), quicncs dcsarrollaron 
cl Custody Quotient lu (Cocienlc de Custodia), 
una elaborada escala de calificacidn basada en 
reactivos que produce una calificacidn de nue- 
ve puntos para cada uno de los siguientes fac- 
tores relacionados con los padres: 

Necesidadcs emocionales del nifio ahora y 
en el futuro. 

Necesidadcs ffsicas del nino ahora y en el 
futuro. 

Ausencia de peligros emocionales o ffsicos 
para el niflo. 

Buenas habilidades de cuidado parental. 

Asislencia del progenitor. 

Planificacidn para el nifto. 

Estabilidad en et hogar. 

Cuidado previo. 

Acts u omisiones. 

Valores. 

El instrument tambidn produce un cocicntc 
general dc custodia o CC (media dc 100), disena- 
do para estimar la competencia de los padres. Los 
autores informan sobre algunos datos empfri- 
cos accrca dc su instrument, incluyendo estu¬ 
dios de concordancia intercalificadores basados 
en valoraci6n de entrevistas grabadas en video. 
En la mayor parte de las escalas, los dos auto¬ 
res se colocaron a una distancia dc dos puntos 
entre sf (en escalas dc calificacidn de nueve 
puntos) en 90 a 100% de las ocasiones. La va¬ 
lidez del instrument se ha evaluado, en parte, 
a travds del anilisis factorial confirmatorio que 
revela un “factor de buena patemidad en gene¬ 
ral" como se predijo. Un cstudio inicial de va¬ 
lidacidn reveld que los padres con un CC mcnor 
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a 100 en pocas ocasiones recibieron la custo- 
dia del niho (cxccpto en casos dondc ambos 
padres recibieron calincacioncs menores a 100). 
Gordon y Peek (1989) reconocen que su ins- 
trumento requiere investigation adicional. 

Otra prueba para la valoracidn de la custo- 
dia infantil cs el Parent-Child Relationship 
Inventory, PCRI (Inventario de Relacioncs Pa- 
dres-Hijo, Gerard, 1993). El PCRI es un inven¬ 
tario de autoinforme con 78 reactivos, adecuado 
para madres y padres de ninos de 3 a IS aiios 
de edad. El inventario incluyc sictc esealas: 

• Apoyo del progenitor. 

• Satis face i6n. 

• Participacidn. 

• Comunicacion. 

• Establecimiento de lfmitcs. 

• Autonomfa. 

• Orientacidn del rol. 

Las normas se basan en una muestra no clfnica 
de mSs de 1 000 padres y madres en todo EUA. 
Como la mayor parte de los instrumentos rela- 
cionados con la valoracidn de la custodia in¬ 
fantil se requiere de mds investigation para 
determinar el valor del PCRI para este tipo de 
evaluaciones. Una preocupacidn especial es que 
los reactivos de prueba son relativamcnte trans- 
parentes, de modo que los padres pueden ses- 
gar a nivel consciente las conclusioncs de la 
prueba en una direccidn favorable. 

Bricklin (1995) ha disehado cuatro pruebas 
sencillas que ban rcsultado utiles en valoracio- 
ncs de custodia. Dos de eilas evaluan habilidad 
y dedication en los cuidados parcntalcs para la 
madre y el padre por separado. En tdrminos 
cspecfficos, el Parent Awareness Skills Survey 
(Examcn de Conscicncia de Habilidades del 
Progenitor) evalua la concicncia sobre las ha¬ 
bilidades de crianza infantil, mieniras que el 
Parent Perception of Child Profile (Perfil de 
Pcrcepcidn Patema acerca del Nifio) valora un 
interns genuino en el niho. En este caso se cen¬ 
tral la atencidn sobre los dos instrumentos res- 
tantes que examinan la percepcidn del nino 
acerca de sus padres: Las Bricklin Perceptual 
Scales, BPS (Esealas Perccptuales Bricklin) y 


la Perception-of-Relationships Test, PORT 
(Prueba de Pcrccpcidn de Relacioncs). 

Las BPS consisten en 64 preguntas que se 
le hacen a cada nino (de cuatro anos de edad en 
adelante) implicado en una disputa de custo¬ 
dia. Hay 32 preguntas que tienen que ver con 
la percepcidn del nifio acerca de su madre y 32 
sc rclacionan con pcrcepciones sobre el padre. 
Las preguntas se encuentran dentro de cuatro 
dreas disehadas para identificar los intcrescs 
primordiales del nifio: capacidad, apoyo, con¬ 
sistency y posesidn de rasgos admirables. 
Lo siguientes son cjemplos de los tipos de pre¬ 
guntas que se realizan: 

• Capacidad: “Si tienes problemas con una bo- 
leta de calificacioncs de la escuela, ^cuanto 
serfa capaz de ayudarte tu mamd? 

• Apoyo: "Cuando te sientes realmente preocu- 
pado, ^cudnto te ayuda tu papd a tranquili- 
zarte?" 

• Consistency: “Si trataras de seguir dormi- 
do en un dfa de escuela £Con cudnta frecuen- 
cia te obligarfa tu mamd a levantarte a la hora 
de siempre?” 

• Posesion dc rasgos admirables: “Si tuvie- 
ras una mascota, ^qud tan bien cuidarfa de 
ella tu papd si te fueras dc campamcnto du¬ 
rante una semana?” 

Las 32 preguntas sobre mamd y las 32 sobre 
papd son idlnticas; sc encuentran ampliamente 
separadas en el cueslionario, a fin de evitar com- 
paraciones inmediatas y obvias. Las preguntas 
se hacen primero dc mancra verbal y despuds se 
repiten con un fraseo un tanto diferente. Por 
ejemplo, el examinador sostiene una idmina de 
prueba frente al nifio; “si dste (sehalando al cx- 
tremo marcado con “Muy Bien") cs tu papd si te 
ayudara muy bien a tranquilizarte y este (seha¬ 
lando al extremo marcado con "No Tan Bien") 
es tu papa sin ayudarte no tan bien a tranquili¬ 
zarte, ^ddndc cstarfa (u papd en esta Ifnea?" El 
niho responde utilizando un punzdn para haccr 
un orificio en la Idmina. Cada una contiene una 
rejilla de calificacidn en el lado opuesto para 
una calificacidn objetiva e inmediata. 

Las calificacioncs de la BPS consisten en 
una comparacidn rcactivo por reactivo dc las 
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calificaciones para mamb y papl Se identifica 
cl Progenitor de Eleccibn (PDE) cn tbrminos 
de cual de ambos, la madrc o el padre, obticne 
la mayor calificacibn en la mayor parte de los 
reactivos: 

Se supone que este progenitor es el mas capaci- 
lado para operar en benelicio de los "intereses 
primordialos” del nifio en la variedad mas amplla 
de situaciones como se les mide con la BPS 
(Bricklin. 1995. p. 77). 

Por supuesto, este resultado cs sblo un punlo 
de la informacibn que utiliza el examinador para 
llegar a una recomendacibn sobre cuslodia. 

La BPS posee varias cualidades positivas 
en comparacibn con otros enfoques para la va- 
loracibn de cuslodia. Primero, la prueba evita 
pedirle al nifio que elija de manera directa en- 
tre sus padres, lo cual reduce al rmnimo la cul¬ 
pa. Tambidn evalua importantes breas de 
atencibn y cuidado que se suponen importan¬ 
tes para el desarrollo sano del nifio. Lo que cs 
mis, al centrarse en las percepciones del nifio 
acerca del cuidado que le brindan sus padres, 
en contraposicibn a las percepciones del exa¬ 
minador acerca de ello, el instrumento propor- 
ciona una voz para aquellos que eslbn en mayor 
riesgo en una dccisibn sobre cuslodia. Bricklin 
(1995) sefiala que la BPS no necesariamente 
tiene el propbsito de ser una medida directa de 
la capacidad de las padres, sino que se Ic dise- 
fi6 para identificar a la persona cuyo estilo es 
congruentc con la capacidad del nifio para 
aprovechar y beneficiarse de la orientaci6n 
parental. 

Aunque la evidcncia acerca de la confiabili- 
dad de la BPS no se encuentra disponible en cl 
trabajo de Bricklin (1995), las conclusiones 
iniciales sobre validez la apoyan. En tbrminos 
especfficos, la BPS produjo 90% de tasa de con¬ 
cordance con las elecciones de progenitor he- 
chas por profesionales de salud mental, quienes 
tuvicron acceso a datos independientes sobre 
antecedentes cltnicos y familiares obtenidos 
durante varios afios. Como nota precautoria 
debe dccirse que, como ocurrc con tantos ins- 
trumentos cn el campo de la valoracibn sobre 
cuslodia, existen pocos (o nulos) estudios em- 


pfricos sobre la BPS publicados en publicacio. 
nes de consulta. Hcize y Grisso (1996) ofrecen 
la siguiente critica: 

Una cuesti6n relaclonada es que las Escalas 
Bricklin intentan responder las dudas legates so¬ 
bre preferencias de custodia sin evaluacibn di- 
recta de las capacidades y deticiencias lunclo- 
nales de los padres, incluyendo la manera en que 
bstas se relacionan con las necesidades de los 
nlfios. AdemSs, las escalas atienden solo de ma¬ 
nera muy superficial a la cuestidn de dos padres 
con deficiencies significativas Asi, debido a que 
las percepciones del nifio acerca de ambos pa¬ 
dres se comparan sdlo entre sf y no con aqub- 
Has sobre otros padres, es posible que el clinioo 
no obtenga muefia informacibn concornionle al 
nivel de funcionamlento parental de un progeni¬ 
tor especffico oomo lo percibe el nifio (p. 301). 

Es claro que serfa deseable mayor investiga- 
cibn de parte de fuentes independientes. 

Otra prueba inventada por Bricklin (1995) 
y que tambidn se basa cn el nifio es la Percep- 
tion-of-Relationships Test, PORT (Prueba de 
Perccpcibn de Relaciones). La PORT es una 
prueba de dibujo proyectivo que puede califi- 
carse para dcterminaral progenitor de eleccibn. 
Se pide al nifio que lleve a cabo sicte conjuntos 
de dibujos, comenzando con uno de cada uno de 
sus padres. La prueba prosigue entonces con 
otros dibujos que incluyen una autorrepresen- 
tacibn en la misma hoja que el dibujo de la 
mamb y despuds en la del papl Se utiliza un 
complejo sistema de calificacibn para identifi¬ 
car al progenitor con el que el nifio busca ia 
“ccrcam'a” psicolbgica. Se considera que ello 
revela la percepcibn del nifio acerca de cubl de 
sus padres le presta mbs apoyo y cs mbs capaz 
de responder a sus necesidades. En una scrie de 
sietc estudios de validez a travds de varios de- 
cenios (Bricklin, 1992), la PORT solfa tener 
90% de precisibn en la prediccibn del progeni¬ 
tor de eleccibn como lo designb un juez de 
un tribunal o clfnicos independientes. 

Una aplicacibn cspccializada para la PORT 
que mcnciona Bricklin (1995) es la deteccibn 
del maltrato ffsico y del abuso sexual. Los cri- 
terios de calificacibn que indican maltrato o 
abuso parecen haberse derivado del saber 
psicoanalftico. Porcjemplo, se considera que 
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todos los siguientes son signos de mallrato o 
abuso: 

• Notable incremcnto en ia distancia entre la 
figura de sf mismo y la del progenitor que ha 
cometido maltrato o abuso en comparacidn 
con la del oiro progenitor que no maltrata o 
abusa de dl 

• Lfneas onduladas o interrumpidas en el drca 
corporal en la que se ha sufrido maltrato o 
abuso (p. ej., drea genital, pecho) 

• Distorsidn de una mano en el dibujo del pro¬ 
genitor que ha cometido maltrato o abuso 

Por desgracia, el apoyo cmpfrico para estas hi- 
pbtesis es limitado, como se analiza con ampli- 
tud en el Tema 13B, Tdcnicas proyectivas. 
Debido a que los alcgatos de abuso sexual han 
sido tan perjudicialescn los trdmites sobre cus- 
todia, los examinadores deben ejcrcer gran 
cuidado al cspccular sobre talcs cuestiones, en 
especial si la evidencia consistc unicamente 
cn pocos dibujos de la figura humana que sc 
consideran sospcchosos. 

Para cerrar esta seccidn se le recuerda al 
lector que el testimonio experto cn valoracio- 
nes sobre custodia infantil deben moderarse 
con una cnorme dosis de humildad de parte del 
psicdlogo examinador. Determinar los intereses 
primordiales del nino es casi siempre una tarea 
diffcil y espinosa. La ausencia de pruebas y md- 
todos adecuadamcnte validados para esta tarea 
garantiza que ia valoracidn de custodia conti¬ 
nuant siendo una de las responsabilidadcs mas 
desafianlcs cn loda la prdctica psicologica. 

Rj LESIONES PERSONALES Y 
01 TESTIMONIO RELACIONADO 


Las lesiones personates como las causadas por 
un accidcnte de automdvil son, a menudo, una 
fuente de demandas enjbusqueda de compen- 
sacidn econdmica. En las demandas por lesio¬ 
nes personales, los abogados pueden contratar 
a psicdlogos para que tcstifiquen en cuanlo a 
las consecuencias crdnicas del cstrds traumdtico 


o del daiio cerebral provocado. Por ejemplo, 
un neuropsicdlogo clfnico podrfa aplicar una 
baterfa complcta de pruebas (capftulo 9, Eva- 
luacidn neuropsicologica y geridtrica) y despuds 
atestiguar en cuanto a las implicaciones fun- 
cionales a largo plazo de un dafio cerebral co- 
nocido. 

En general, un psic6!ogo consultor que rin- 
de testimonio ante un tribunal se enfrentard con 
normas sumamentc clevadas para cjercicio pro- 
fcsional. Ya se ha mcncionado la norma Frye, 
que dispone que el testimonio debe basarse en 
pruebas y procedimientos que hayan “obtenido 
aceptaci6n general" en cl campo. Asf, una prue- 
ba o procedimiento que es relevante o util cn la 
prdctica clfnica cotidiana —pero que no ha re- 
cibido total aceptacidn en el campo— podrfa 
rccibirsc con esccpticismo dentro de los tribu- 
nales. Incluso un juez podrfa resolver que el 
testimonio es inadmisible si se basa en pruebas 
o proccdimientos con una validacidn frdgil. 
Peor aun, el juez puede aceptar dicho testimo¬ 
nio, lo cual deja al testigo experto a merced de 
la crftica y ridiculizacidn de los abogados de la 
parte contraria. Con estas preocupaciones en 
mente, Heilbrun (1992) ha publicado pautas 
para la prdctica de la evaluacidn forense que se 
resumcn a continuacidn: 

• Las pruebas deben cstar disponibles a nivel 
comercial y estar bien documcntadas, como 
cn cl Mental Measurements Yearbook. 

• La confiabilidad debe estar bien documenta- 
da y ser de .8 o mayor, cxcepto en circuns- 
tancias poco comunes. 

• Las pruebas deben relacionarse con la cucs- 
tidn legal o con un constructo psicoldgico 
subyacente a la misma. 

• Deben utilizarsc los mdtodos estdndar de apli- 
cacion, con condiciones ideales de prueba. 

• Las pruebas deben haberse validado en una 
poblacidn apropiada que se relacione con el 
individuo al que se evatiia. 

• Cuando sea posibie, los profesionalcs debe- 
rdn utilizar pruebas objetivas con fdrmulas 
actuariales para la interpretaci6n. 

• Los profesionales deben ser cuidadosos al 
verificar la cxistcncia de simulacidn. defen- 
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sividad y otras razones que obliguen a pasar 
por alto o ignorar los datos de prueba. 

Paulas adicionales pucden encontrarse en las 
Specialty Guidelines for Forensic Psychologists 
(Comittee on Ethical Guidelines for Forensic 
Psychologists, 1991). 

Cada vez es mis frecucntc quc los tribuna- 
lcs hayan cstado dispucstos a otorgar compen- 
sacioncs por dados mentalcs ademris de danos 
fifsicos. Este tipo de lesiones se conoce como 
"trauma psfquico”, “angustia emocional” o 
“pcrjuicio emocional”. La evaluacidn del dano 
emocional depended, en cierta medida, de los 
resultados de una prueba psicoldgica (en parti¬ 
cular, pruebas de personalidad), pero la cvalua- 
ci6n requicrc gran habilidad clfnica que incluya 
“anteccdcntcs longitudinales del dano, su tra- 
tamiento y los intentos de rehabilitacidn, inclu- 
yendo la motivacidn del demandante para 
rccuperarse" (Melton et al., 1998, p. 381). 
Una vez mis puede obscrvar.sc que la cuestidn 
de la simulacidn persigue a la mayor parte de 
las formas de evaluncion forense. 

B interpretaci6n de prueba 

DE POUGRAFO 


Aunque por lo general los resultados de polfgra- 
fo no se aceptan en los casos judiciales, cerca 
de 20 estados de EUA permiten el lestimonio si 
ambas partes en un proceso est^n de acucrdo 
en que se utilice la evidcncia. Cuando mcnos dos 
estados (Massachusetts y Nuevo Mdxico) per¬ 
miten el testimonio aun si la parte contraria se 
opone (Wrighlsman el al., 1994). En casos en los 
que se emplea la prueba de polfgrafo, es posi- 
ble pedir a los psicdlogos que ofrezean su testi¬ 
monio experto. A continuaci6n se proporciona 
una breve revisi6n de la prueba de polfgrafo. 

William Marston, un estudiante de Hugo 
Munstcrbcrg en la Universidad de Harvard, fue 
quien desarrolld el polfgrafo alrededor de 1917. 
El rudimentario enfoque de Marston consistfa 
en medir la presidn sangufnea sistdlica de un 
sospechoso durante el interrogators. Este in- 


vestigador consideraba que la presidn sanguf¬ 
nea sistdlica se clevarfa de manera gradual si la 
persona examinada intentaba engafiar al exa- 
minador. Su poldmica tdcnica fue el proccdi- 
miento que se puso en duda en el sobresaliente 
caso de Frye contra EUA (1923). El lector 
rccordara que la dccisidn del caso Frye ayudd a 
definir las requisitos solicitados de un testigo 
experto, al dcfinirlo como la persona quc utili- 
za un metodo quc "... ha obtenido accptacidn 
general en el campo particular al que pertenc- 
ce”. En el caso Frye, el tribunal no aceptd el 
testimonio de Marston, dado que su enfoque 
de “detector de mentiras" no habfa recibido 
amplia accptacidn. 

El polfgrafo modemo es sustancialmcnte 
mis complejo que su rudimentario prcdccesor 
crcado por Marston. En una prueba modema 
de polfgrafo se conectan varios monitores al 
cucrpo dc la persona examinada: un brazalelc 
para medir presidn, un monitor dc frccuencw 
cardiaca, un aro flexible alrededor del pecho 
para registrar la respiracidn y conductos eldc- 
tricos en los dedos para dctcctar los cambios 
en actividad electrica de la piel. El polfgrafo 
registra las respuestas ffsicas que ocurrcn al 
momento, las cuales incluyen cambios en res- 
piracidn, pulso, presidn sangufnea y transpira- 
ci6n. Los cambios en esta ultima no se miden 
dc manera directa, sino por medio dc un par dc 
elcctrodos quc cstiman los cambios en conduct!- 
vidad electrica en la supcrficic de la piel. Inclu- 
so un ligero incremcnto en la humedad debida 
a la transpiracidn facilila la conductividad dc 
una corricnte eldctrica sobre la superficic de la 
piel. La palabra polfgrafo sc traduce de modo 
literal como "muchas escrituras”. Las respues¬ 
tas fisioldgicas se presentan en un conjunto dc 
Ifncas fluctuantes dibujadas en tinta sobre un 
rollo dc papel en movimiento continuo. 

La justificacidn para el empleo del polfgra¬ 
fo como detector dc mentiras sc deriva dc la 
observacidn dc quc muchas personas reaccio- 
nan con un aumento en Ja excitacidn fisioldgi- 
ca cuando dicen una mentira. Al menos en 
teorfa, las respuestas vcraccs sc acompanan de 
lfneas relativamente planas, mientras que se 
supone que una mentira causa fluctuaciones 
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significativas y faclibles de dcteccion en fre- 
cucncia cardiaca, transpiracidn y quizbs tarn- 
bien cn otras medidas. Asf, un proccdimiento 
comun en la prueba dc polfgrafo consiste cn 
comparer las rcspucstas a una prcgunta neutra 
o control (“£hoy es jueves?”) con respuestas a 
una pregunta rclacionada (“/.robb usted al Pri¬ 
mer Banco Intcrcstatal cl pasado vicmcs?’’). 

Aunque es comun llamar al polfgrafo "de¬ 
tector de mentiras”, esta denominacibn colo- 
quial es sustancialmente imprecisa, debida en 
gran parte, a los propios expcrtos cn su uso. En 
consecucncia, cn nucstros dfas rodca al polf¬ 
grafo una vasta milologfa. Dc hecho, estc apa- 
ntto detecta las respuestas fisiolbgicas, no las 
mentiras. Una rcspuesta fisiolbgica distintiva 
tegistrada por un polfgrafo puede o no ser se¬ 
rial de una mentira —dsta es una cuestibn em- 
pfrica abierta a investigacibn. 

El polfgrafo no “sucna” al momcnto de 
dccir una supucsta mentira; es un examinador 
quien dcbe intcrprctar el patrbn de respuestas 
fisiolbgicas. En csto reside una dc las limita- 
ciones sustancialcs de dicho instrumcnto: se re- 
quiere una gran cantidad de interpretacibn 
basada en juicios para dctcrminar cutiles "se- 
nalcs” son significativas y cudles son coinci- 
dencias. Por desgrecia, los juicios "expertos" de 
los tdcnicos cxperimentados en el polfgrafo no 
se sostiencn muy bien ante las prucbas empfri- 
cas en el mundo real (Carroll, 1988; Lykken, 
1981, 1987). En un cstudio de campo accrca 
dc la precisibn dc la interpretacibn del polfgra¬ 
fo, Kleinmuntz y Szucko (1984) prcscntaron lo 
quc quizbs es cl rctrato mcnos halagador acer- 
ca dc la precisibn dc los expertos cn polfgrafo. 
Los autorcs recolectaron lecturas de polfgrafo 
de 50 personas de quicnes se probb posterior- 
mentc que eran ladrones y de otras 50 de quie- 
ncs habfa sospechas sobre los mismos robos y 
quc despuds fucron cxoneradas. Adcmas, sc ana- 
dieron 20 eases no vcrificados, como dc “amor- 
liguacibn” o “rcllcno”, pero quc no sc incluye- 
ron en los anblisis. 

Las pruebas de polfgrafo se presentaron a 
seis expertos sumamentc experimentados cn cl 
uso del instrumcnto, y sc les dijo que la mitad 
dc la mucstra era culpable y la otra mitad ino- 
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cente. Los resultados del estudio consistieron 
en el cbmputo de las identificaciones correctas 
e incorrectas por parte de los intbrpretes. El lec¬ 
tor rcconocerb que los intdrpretes estarfan en 
lo correcto en 50% dc las ocasiones sblo por 
adivinar. Tambidn debe senalarse que eran po- 
sibles varias categorfas dc clasificacibn: positi¬ 
ves validos (personas culpables identificadas 
como tales), negalivos vblidos (personas ino- 
centcs identificadas como tales), falsos positi¬ 
ves (personas inocentes identificadas como 
culpables) y falsos negativos (personas culpa¬ 
bles identificadas como inocentes). Kleinmuntz 
y Szucko (1984) tambidn convirtieron las lec¬ 
turas dc polfgrafo cn datos digitales con pro- 
pbsitos dc un anblisis funcional discriminative. 
En un anblisis de este tipo, sc utilizan factores 
estadfsticos puramente objetivos para clasifi- 
car a los participantes con la mayor precisibn 
posible. 

Los resultados del estudio fucron inespe- 
radamente desalentadorcs. En promedio, los 
interprctes cstuvieron en lo correcto en 69% de 
las ocasiones, sblo 19% por arriba de la mcra 
adivinacibn. El anblisis funcional discriminative 
tuvo un desempefio un tanto mejor, llcgando a 
73%. El mejor interprete estuvo cn lo correcto 
sblo 76% dc las veces. Las tasas de error en 
estc cuidadoso estudio fueron alarmantcmcntc 
elevadas, en especial en el caso de los falsos 
positivos —personas inocentes identifica¬ 
das como culpables. Incluso el mejor inldrpre- 
te dc polfgrafo clasificb a 18%, o 9 de las 50 
personas inocentes, como culpables. 

Blinkhorn (1988) resume de la siguiente 
manera una perspectiva psicomdtricamente in- 
formada accrca del polfgrafo: 

B ernpleo del poligrafo como detector de menll- 
ras estb muy lejos de satisfacer los estbndares 
aceptables para las pruebas psicolbgicas. En 
esencia, no tiene estandarizaerbn; es inconsis- 
tente a nlvel Interne; la recaliflcactfn de las grbfl- 
cas es poco confiable; no se dispone de ningtin 
tipo do intormacibn de contiabilidad para los 
oxaminandos; produce un numero desproporcio- 
nado do resultados positivos talsos; no se ha in- 
vesligado su Impacto adverso en subgrupos so- 
ciales y btnicos; implica la medicidn de aspectos 
sensibles del temperamento (p. 39). 



1 


472 • Evaluation psicoldgica: Hlslorla, prlnciplos y aplicaciones 


(Capilulo 10) 


Otros antilisis son m&s favorables, pero no tan- 
to como para quc los cxpertos legates se apre- 
suren a promover el polfgrafo como evidencia 
cn cl tribunal. Saxe, Dougherty y Cross (1985) 
examinaron 10 estudios de campo accrca dc la 
precisidn del polfgrafo. En dstos, la tasa pro- 
medio de clasificacidn correcta de personas ino- 
ccntes fuc de 89% (rango de 77 a 100%), 
mientras que aqudlla para individuos culpablcs 
fue de s61o 82% (rango de 47 a 100%). Recien- 
temente, un importante estudio de campo so- 
bre la prueba de polfgrafo por parte del Servicio 
Sccreto de EUA concluyd quc los examinado- 
rcs identificaron de mancra correcta a 96% de 
los individuos vcraccs y a 95% dc los sospe- 
chosos que mintieron (Raskin, 1989). Elaad, 
Ginton y Jungman (1992) tambidn analizaron 
la precisidn del polfgrafo en investigaciones 
delictivas reales. Recopilaron los registros de 
polfgrafo de pares de personas acusadas del mis- 
mo delito (p. ej., robo dc una grabadora de vfdeo 
de una base militar). En total, utilizaron los re¬ 
gistros de 40 personas inocentes y 40 culpa¬ 
blcs, dc quienes postcriormcntc se establecid 
la verdad a travds de confesidn voluntaria. Al 
utilizar reglas objetivas de decisidn, se clasiHcd 
de manera correcta a 94% dc las individuos ino¬ 
centes y sc identified de modo adccuado a 76% 
de los culpablcs. En conjunto, todos cstos cstu- 
dios brindan apoyo al empleo del polfgrafo cn 
las ctapas de investigacidn de un caso delictivo. 
No obstante, las tasas de error son todavfa de- 
masiado clevadas como para que sc aceptc 
como evidencia en un tribunal (Honts y Perry, 
1992). 

En ados recicntcs, cl polfgrafo parece ha- 
ber tenido un retomo limitado. Por ejemplo, el 
cstado de Texas controla a los delincucntcs 
sexuales con pruebas de polfgrafo, lo cual con- 
trapone los derechos civiles con la seguridad 
del publico (Prensa Asociada, 16 de mayo de 
1997). En un caso, un vardn de 33 anos que 
estaba en libertad condicional por abusarde un 
nifio pequeno, “fall6” una prueba de detector 
de mentiras concemicntc al contacto sexual con 
ninos. Cuando se le confrontd con ello, confe- 
s6 haber tenido actividad sexual con un joven 
de 15 anos de edad y despuds cnfrent6 una sen- 


tencia de prisidn por violar la libertad condicio¬ 
nal. Cada vez es mds frecucnte que los siste- 
mas judicialcs dependan del detector de mentiras 
para vigilar a los delincucntes sexuales (50 000 
tan s61o en el estado de Texas), lo cual hace 
surgir preguntas legates y dticas diffeiles. Una 
preocupacidn es cl problema de los falsos posi¬ 
tives, en los que se tienc sospccha dc un delito 
sexual en el caso de una persona inocentc con 
base cn las crestas observadas en las Ifneas 
continuas de tinta de una prueba de polfgrafo. 
En una encuesta con 195 psicdlogos dc la Society 
for Psychopltysiological Research, la mayorfa 
de los entrevistados respondieron que la dctec- 
ci6n de mentiras por este medio no es tedrica- 
mente sdlida, que medidas contrarias que se 
aprenden con facilidad pueden veneer a una 
prueba dc mentiras y que los resultados de prue¬ 
ba no deberfan admitirse cn los tribunales 
(lacono y Lykken, 1997), 


H CONTROVERSY ACERCA 
> DEL PSIC6LOGO COMO 
3 TESTIGO EXPERTO 


A partir de los temas anteriores deberfa ser evi- 
dentc que el testimonio experto de los psicdlo¬ 
gos puedc alterar la vida dc las personas. Como 
observan Faust y Ziskin (1988): "Depcndiendo 
de la opinidn del experto, un individuo puede 
terminar recluido cn una institucidn mental, 
recibir fuertes recompensas monetarias, obte- 
ner la custodia de un nino o perder la vida”. 
Estos autores tambicn sciialan que los clfnicos 
participan cuando menos cn un milldn dc ca- 
sos legates cada afio, de modo que el impacto 
potencial del testimonio experto es trascenden- 
tal. Es adecuado concluir esta scccidn sobre 
cucstioncs legates y judiciales con una breve 
mencidn accrca de la poldmica que rodca al 
psicdlogo como testigo experto. 

En un libro en tres volumenes intitulado 
Coping With Psychiatric and Psychological 
Testimony , Ziskin y Faust (1988) proporcionan 
una perspcctiva completamcnte cscdptica acer- 
ca del clfnico en los tribunales. Estos autores 
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resumen sus principals conclusiones cn un 
artfculo mds breve (Faust y Ziskin, 1988). Su 
cntica reside en dos afirmaciones: 

1. Los (estigos expertos en psicologfa (y psi- 
quiutrfa) no pueden responder a las prcgun- 
tas forenscs con una precision razonable. 

2. Estos expertos no ayudan al juez y al jurado 
a llegar a conclusiones mds cxactas de lo que 
sen a posible de otro modo. 

La primcra alirmacidn se fundamcnta en gran 
medida en la supuesta incapacidad de los clfni- 
cos para proporcionar diagncSsticos psiquid- 
tricos correctos. El argumcnto va mas o mcnos 
asf: si los clfnicos no pueden descmpenar de 
manera precisa una larea tan fundamental como 
la clasificacion o diagndstico de los pacicntcs, 
^cdmo serfa posible que realizaran el trabajo 
mils complejo dc detcrminar el estado previo, 
actual o futuro de la persona bajo escrutinio? 
Asf, los problcmascon la confiabilidad del diag- 
ndstico se utilizan para ilustrar la dificullad mds 
general de lograr concordance entre los clfni¬ 
cos acerca de las descripciones o prcdicciones 
del estado pasado, actual o futuro de la persona 
examinada. Para apuntalar su postura, Ziskin y 
Faust (1988) citan numerosos estudios que de- 
muestran la falta de confiabilidad del diagnds- 
tico psiquidtrico, incluyendo algunos andlisis 
que muestran que la lasa de desacuerdo para 
categories diagndsticas cspecfficas es igual o 
superior a la tasa de acuerdo. 

El segundo argumento se basa en la conjun¬ 
ct de resultados de investigacidn que sugie- 
rtn que los clfnicos profcsionales no rcalizan, 
de hecho. juicios clfnicos mds correctos que los 
legos (Ziskin y Faust, 1988). Porejemplo, Faust 
y Ziskin (1988) citan un estudio cldsico de 
Goldberg (1959) en el que secretanas dc ofici- 
na tuvieron un desempefio tan adccuado como 
el de los psicdlogos profesionales cn distinguir 
lus producciones visomotoras de personas nor- 
uiales contra las de aqudllos con dafio cerebral 
end Test Guestdllico Msomotorde Bender, una 
prueba de copia de diserkos. En el estudio de 
Goldberg (1959), la mitad de los dibujos en la 
Prueba de Bender eran de pacicntes con enfer- 


medad cerebral orgdnica confirmada, mientras 
la otra perteneefa a individuos normales; por 
tanto, la prccisidn diagnostics alcatoria era dc 
50%. Se pedfa a los pnrticipantes en el estudio 
que realizaran un juicio para los dibujos de cada 
uno de los individuos con dos altcmativas: nor¬ 
mal contra dafio cerebral. En promedio, el per¬ 
sonal de psicologos con doctorado clasificd dc 
manera correcta a 65% dc los protocolos, los 
estudiantcs de posgrado en psicologfa tuvieron 
70% dc dxito y las secretarias alcanzaron 67% 
de prccisidn. Ziskin y Faust (1988) citan mu- 
chos otros estudios que ilustran cl mismo te¬ 
nia general de inexistencia dc diferencias en 
la precisidn dc los juicios clfnicos entre clfni¬ 
cos profesionales y legos. 

En defensa del testimonio experto, varios 
autores han criticado el andlisis de Faust y 
Ziskin (1988) debido a su acadcmicismo com- 
balivo y a su falta dc cquilibrio (Brodsky, 1989; 
Fowler y Matarazzo, 1988; Hcilbrun, 1992; 
Matarazzo, 1990). Por ejemplo, en su revisidn 
de los estudios acerca de la precisidn del diag- 
ndstico, Matarazzo (1983, 1990) concluyd que 
los resultados indican magnitudes de confia¬ 
bilidad que van de adecuadas a muy adecua- 
das; este autor cita muchos estudios positivos 
que no se mencionan en el trabajo de Faust y 
Ziskin (1988). Lo que es mds, Fowler y Matarazzo 
censuran el dnfasis sesgado sobre la prccisidn 
diagndstica; 

La ctaslficacibn diagnostics por si sola es. en 
pocas o ningunas ocasiones, la base sobre la 
cual se toman determlnaciones legates. Cues- 
liones legates como la Insania, dlscapacidad y 
competence se basan mds en la comprensiOn 
del juez o del jurado acerca de la conducts y ca- 
pacldad de un Indivtduo para (uncionar en situa- 
ciones especificas que en el diagnOstico concre- 
to que se le asigna al mismo. 

Coincidimos en que Faust y Ziskin (1988) revi- 
saron la bibliograffa deliberadamente unilateral 
y que ignora las conclusiones que apoyan a la 
psicologfa forense. Por ejemplo. considdrese 
un dctallc del estudio de Goldberg (1959) —un 
detalle que, no por coincidencia, Faust y 
Ziskin (1988) pasan por alto. Ademds de utili- 
zar a psicdlogos, profesionales en entrenamiento 
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y secretarias como jucces, Goldberg (1959) Ic 
pidi6 a un renombrado experto en la prueba 
Bender que clasificara los protocolos. El ex¬ 
perto logrd las mejores tasas de clasificacirin 
entre todas: un impresionante 83% correcto.* 
Con base cn una revision de esludios sobre jui- 
cio clfnico. Garb (1992) concluyc que los pro- 


j&j RESUMEN 

1. La prdctica de la psicologfa confluye con cl 
sistema legal cn diversas Areas que inclu- 
yen la valoracidn de simulacidn, cvaluacidn 
del estado mental (para la defensa de insa- 
nia), cvaluacidn de competencia para estar 
sujeto a juicio, prediccidn de violencia y 
valoracidn de custodia infantil. 

2. Para fungir como testigo experto, un psied- 
logo debe ser un experto calificado en opi- 
nidn de la corte. En general, el testimonio 
se reslringc a tdcnicas que han estado dis- 
poniblcs por un tiempo prolongado a fin de 
tener antecedentcs de accptacidn general 
(Frye contra EUA, 1923). 

3. En cvaluaciones forenses, el profcsional 
debe tener fuertes sospcchas de simulacidn, 
pero debe llcgar a tal conclusion de mancra 
cauta debido a las consecuencias para el 
clicnte. Herramicntas como la Enlrcvista 
Estructurada de Sfntomas Informados pue- 
den ayudar cn la evaluacidn de la simula¬ 
cidn. 

4. Los expertos en jurisprudencia tienen am- 
plio respeto por la defensa de insania, y este 
argumento sc invoca en menos de 1 de cada 
1 000 juicios. En la actualidad, la mayor 
parte de los estados en EUA siguen la regia 
M’Naughten o el Cddigo Penal Modelo 
como pruebas legates de insania. Algunas 
jurisdicciones aceptan cl “inipulso irresis¬ 
tible” como complcmcnto. 


* El experto fue Max Hutt, quien dcspuls cscribid The 
Hull Adaptation of the Bender Gestalt Test (1977). 


fesionales de la salud mental (y en especial log 
psicdlogos) son mAs prccisos en sus juicios qu e 
los legos; es deeir, tienen algo significativo 
que ofrccer a jueces y jurados en casos forenses. 
Es claro que no puede negarsc la falibilidad del 
clfnico individual, pero csta cuestidn no justifica 
la eliminacidn de los expertos en los tribunates. 


5. Scgun la regia M'Naughten, puede consi¬ 
derate que una persona no es culpable de¬ 
bido a insania si “al momento de cometcr 
el acto, la parte acusada sc encontraba bajo 
tal defecto de razOn, de enfermedad de la 
mente, que no conocfa la naturaleza y cali- 
dad del acto que cometfa; o, de conocerlo, 
no sabfa que era incorrecto". 

6. El Cddigo Penal Modelo propone que “una 
persona no cs responsable de conducts cri¬ 
minal si en cl momento de ocurrirdichacon- 
ducta, como resultado de enfermedad o 
defecto mental, carece de la capacidad sus- 
tancial ya sea para apreciar la criminalidad 
(incorrcccidn) de su conducta o para some- 
terla a los requisitos de la ley”. 

7. Una adicidn recicntc a la jurisprudencia le¬ 
gal es cl veredicto de Culpable Pero Men- 
talmcntc Enfermo. Su empleo tiene varios 
defectos que incluycn la confusidn por 
parte de los jurados y las sentcncias mAs 
duras que si sdlo se encontrara culpable a 
la persona. 

8. Las esealas de calificacirin como las Esca- 
las Rogers de EvaluaciOn de Rcsponsabili- 
dad Criminal proporcionan una base util 
para valorar el estado mental del acusado 
al momento de la ofensa (MSO). No obs¬ 
tante, los analistas sugieren precaucidn en 
la aplicacidn de dsta y otras esealas simila- 
res debido a que podrfan conducir a un fal- 
so sentido de certidumbre cientffica acerca 
de cuestioncs inhercntcmcnle intuitivas y de 
juicio. 
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9. Es frecuentc quc los tribunnlcs pidan a los 
psictilogos que ayuden a dctcrminar si un 
acusado cs competente para cstar sujeto a 
juicio. En general, la competencia implica 
que el acusado es capaz dc comprcnder los 
cargos en su contra, puede coopcrar con el 
abogado de su defensa y dar una buena pre¬ 
sentation de sf mismo durante el juicio. 

10. La prediccidn de violencia y evaluation del 
riesgoes otra (area vinculada con tribunates 
quc cn ocasiones se solicita de los psicdlo- 
gos. Por dcsgracia, no se ha desarrollado 
ninguna prueba o proccdimiento psicomti- 
trico que proporcione una predicciOn de 
largo alcance de la violencia. En contras- 
tc, la prcdiccitin dc corto alcance de la vio¬ 
lencia o riesgo ha cncontrado mayor tixito. 

11. Areas adicionales de evaluacidn en cues- 
tiones delicadas incluyen las disputas sobre 
custodia infantil en las que, en pocas ocasio¬ 
nes, los resultados de pruebas psicolOgicas 
son tidies; y los casos de dados personates, 
en los quc las pruebas psicoldgicas pueden 
representar una funcidn import ante para 
documentar los efectos del dado. 


12. Se han propuesto varios instrumentos y cs- 
calas dc cvaluacitin para proporcionar un 
medio objeti vo para rcalizar rccomendacio- 
nes sobre custodia infandl. A pesar de quc 
proporcionan informacidn titil, estas herra- 
mientas pueden prometer mtis dc lo quc 
cumplen, desde cl punto de vista de validcz 
psicomtitrica. 

13. Un polfgrafo detecta las respuestas fisiolo- 
gicas, to mo los cambios eltictricos de la piel 
ante cicrtas preguntas dc interrogatorio, y 
las representa como Ifneas de dnta sobre 
papel. La investigaci6n apoya al cmplco del 
polfgrafo en lias etapas de investigacidn dc 
uncaso delicti vo, pero las tasas dc error atin 
son demasiado elevadas como para utilizar- 
to en juicios. 

14. Los esctipticos discuten que los testimonios 
de expertos en psicologfa (y psiquiatrfa) no 
pueden responder a las preguntas forenses 
con precisitin razonable y no ayudan al juez 
y ni al jurado a llegar a conclusiones intis 
corrcclas de lo quc serfa posible de otra ma- 
nera. Estas opinioncs parcccn basarsc en 
revisiones unilatcralcs dc la investigacitin. 


j j TERMINOS Y CONCEFTOS CLAVE 


Testigo experto 

p. 452 

C6digo Penal Modelo 

p. 457 

Simulation 

p. 454 

Culpable Pero Mcntalmcnte Enfermo 


Estado Mental al Momcnto de 


(CPME) 

p. 437 

comeler el Delito (MSO) 

p. 455 

Competencia para cstar sujeto 


No culpable a causa de insania 


ajuicio 

p. 459 

(NCCI) 

p. 455 

Valoraciones sobre custodia 

p. 469 

Regia M’Naughten 

p. 456 

Lesiones personates 

p. 469 

Regia de Durham 

p. 456 

Polfgrafo 

p. 470 
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La psicologfa industrial y organizacional 
(psicologfa I/O) cs una subespecialidad de la 
psicologfa que irata sobre la conducta en situa- 
ciones de trabajo (Dunncttc y Hough. 1990, 
1991, 1992). En su sentido mds amplio, la psi¬ 
cologfa I/O incluye diversas aplicaciones en 
negocios, publicidad y el ejdrcito. Por ejemplo, 
cs comun que las empresas consulten a los psi- 
cdlogos I/O para ayudar a dtsehar y valorar los 


procedimientos de contratacidn; los negocios 
pucdcn solicitarles que evaluen la eficacia de 
la publicidad; y los Ifderes null tares dependen 
en gran medida de ellos para el examen y colo- 
cacidn de reclutas. Las pruebas psicoldgicas al 
servicio de la toma de decisiones acerca del 
personal (contratacidn, colocacidn, asccnsos y 
valoracidn) son, por tanto, un importante punto 
de esta profesidn. Por supucsto, los espccialistas 
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cn psicologfa I/O licncn amplias habilidades y 
con frecuencia mancjan muchas responsabili- 
dadcs corporativas que no sc niencionan antes. 
No obstante, no puede negarse el papcl central 
de la cvaluacidn en su profesidn. 

El propdsito de cste capftulo cs revisar las 
numcrosas mancras en que los psicdlogos I/O 
pueden utilizar las pruebas y los proccdimienlos 
de evaluacidn para los propdsitos antes mencio- 
nados. Tambien se introducira al lector en algu- 
nas de las cuestiones y controvcrsias que pueden 
surgir en la seleccidn y cvaluacidn de los emplea- 
dos. En cl tema 11 A, Evaluacidn y seleccidn 
de personal, se analizan las prdclicas de prueba 
para la seleccidn de empleados y se introducen 
los instrumentos pertinentes. En el tema 11B, 
Estimacidn del dcsempefio en el trabajo, se 
atiende el complicado problema de la valora- 
cidn del desempeno. Tambiin sc revisan allf los 
as pectus legales y los cfectos de los reglamcntos 
gubemamentalcs sobre la cvaluacidn industrial. 

./.;• ESQUEMA PARA LA EVALUACl6N 

H Y selecci6n de personal 


ASPECTOS CLAVE EN LA EVALUACJ6N 
DE PERSONAL 

Es importante tener un esquema para comprcn- 
der cl papel intrincado y multifacdlico del psi- 
cdlogo I/O en la evaluacidn y seleccidn de 
personal. Un elemento crucial —que con fre¬ 
cuencia se pasa por alto en los anAlisis de los 
enfoques sobre pruebas y cvaluacidn— es que 
los psicdlogos I/O deben ser mSs que mcros 
especialistas cn pruebas. Este elemento es de 
particular importancia cn la seleccidn de per¬ 
sonal, la cual requiere de mucho mds que el 
simple conocimiento sobre las pruebas que po- 
drfan utilizarse. A fin de utilizardc mancra pru- 
dente las pruebas para esta labor, el psicdlogo 
I/O debc estar versado cn diversas cuestiones 
complejas. Por ejcmplo, el conocimiento deta- 
llado de la tcorfa de decisidn. que se analiza en 
cl tema 4A, Conceptos bdsicos dc validez, es 


esencial para la utilizacidn eficazde las pruebas 
en la seleccidn de personal. Elcmentos de la 
tcorfa de decisidn, como las tablas Taylor- 
Russell, proporcionan una base para dclcrminar 
la proporcidn esperada de solicitudes exitosas 
seleccionadas con una prueba. Un psicdlogo I/O 
serfa muy torpe cn cmbarcarse en un nuevo 
programa de seleccidn de empleados sin consi- 
derar las tablas Taylor-Russcll y la tcorfa dc de¬ 
cisidn. AdemtSs, el asesor prudente deberfa tener 
un conocimiento bien fundamenlado acerca de 
los conceptos sobre sesgo de prueba que se 
analizan en cl tema 7B, Sesgo de una prueba y 
otras controvcrsias. Por razones legales y id¬ 
eas, los ncgocios desdefian el cmplco de pruebas 
tendcnciosas. Por lo comun, es responsabili- 
dad del psicdlogo la scleccidn o dcsarrollo dc 
pruebas que no tengan sesgo, incluyendo los 
criterios objetivos mediante los cuales se valo- 
ra dste. Dc la misma manera, el especialista cn 
personal debe comprender las cuestiones lega¬ 
les relacionadas con las pruebas de empleo, las 
cuales sc analizan al final dc este capftulo. 

En cl cuadro 11-1 sc esbozan las muchas 
preocupaciones de los psicdlogos I/O en la se- 
leccidn de personal, el cual proporciona una 
sinopsis de los principals problcmas relacio- 
nados con las pruebas y la evaluacidn. Esta lis- 
ta dc aspcctos clave no pretende ser exhausliva, 
pero sf trasmite la amplilud dc preocupaciones 
que se enfrcntan en la aplicacidn dc pruebas 
para la seleccidn de personal. El lector obser- 
vard que un drea dc conocimiento experto que 
el psicdlogo I/O ncccsita es el andlisis de pues- 
los, el cual consiste de la idcntificacidn dc los 
criterios para el desempeno eficaz en cl traba- 
jo. Un andlisis de puestos concienzudo puede 
proporcionar los elementos escnciales para la 
seleccidn de personal. Por tal razdn, sc anali¬ 
zan los enfoques acerca del mismo antes dc 
volvcr a otras cuestiones dentro de la seleccidn 
de personal. 

ANAUSIS DE PUESTOS 

En grandes empresas y pequenos ncgocios por 
igual, los elementos escnciales del ixito de la 
organizacidn son los trabajos individuales que 
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Cuadro 11-1. Recopilacidn de 
cuestioncs clave en las pruebas 
y evaluacion para seleccion 
de personal 


Analisis de puestos: ^Cubles son los cnterios 
especflicos para el dosempeno eficaz en el puesto? 

Pruebas y evaluaciones: ^Las estrateglas y pro- 
cedimienlos de selection poseen una relation de- 
mostrada con el desempeno eficaz en el puesto? 

Puntuaciones de corte: ^Cubl es la proportion 
esperada de solicitantes exitosos seloccionados 
con una prueba de validez conocida? 

Efectividad de costos: Si se incluyen los costos 
de las pruebas y seleccion, ^cubles procedimien- 
los de evaluation producen el mayor beneficio 
general? 

Sesgo de la prueba: i,Las pruebas y los procedi- 
mientos de evaluackSn evidencian sesgo en contra 
de una o mbs minorfas? 

Pautas legates: ^Las pruebas y los procedimien- 
tos de selection satisfacen las pautas federates 
sobre exbmenes imparciales de empleo? 

Estudios de validez: i,Cubl es la validez en curso 
del programa de selection de personal? 


Ilevan a cabo emplcados cspccfficos de todos 
niveles —desde la gercncia hasta el recluta ne6- 
filo. La manera en que sc dcfinen los puestos 
es crucial para la direccidn y crecimiento de la 
organization. Cascio (1987) ha descrito las prc- 
guntas que pueden haccrsc cuando se exami- 
nan las organizaciones nuevas o existentes 
desde la pcrspcctiva de lo puestos de trabajo: 

iCuantos puestos deberbn cubrirse y cuil sera 
la naturaleza de Ostos? 4 Quo capacidades, hablli- 
dades y caracteristicas personates se requerirSn 
de los omploados? ^Cubntos Individuos se reclu- 
tarSn? 1 Q 06 factores (personales, soc tales y t 6 c- 
nicos) deber&n tenorse en cuenta en la seleccion 
de eslos Individuos? ^Corno se les debe entre- 
nar y quo criterlos se utilizaran para medir qu£ 

Ian bien se ban desemponado en su Irabajo? 

Antes de que pueda responderse a estas pre- 
gunlas, los administradorcs deben definir los 
puestos en cucstiOn y despuds idcntificar las 
habilidades y conductas del empleado que son 
necesarias para desempefiar cada labor. Este 


proceso, conocido como anblisis de puestos, cae 
de manera apropiada dentro del campo de ac- 
ciOn del psicOlogo I/O. En este caso se revisa- 
rbn algunos dc las problcmas de evaluation que 
surgen del anblisis de puestos y se revisarbn 
algunos cuestionarios estandarizados que sc 
utilizan para este proposito (Harvey, 1991). 

En tdrminos generalcs, cl analisis de puestos 
consiste de la definition de un puesto en tbrminos 
de las conductas necesarias para cumplir con 
61. liste incluye dos componcntes principales: 
description y especificaciOn del puesto. La des¬ 
cription del puesto idcntifica las caracterfsticas 
fTsicas y ambicntalcs del trabajo a rcalizar, mien- 
tras que la especificaciOn del mismo dctalla las 
caracterfsticas personales necesarias para rca¬ 
lizar dicho trabajo. Por ejemplo, una descrip¬ 
tion dc un puesto secretarial podrfa senalar que 
la persona debe ser capaz dc manejar ocasio- 
nalmente quejas telefOnicas, mientras que la 
especificaciOn correspondiente del mismo po¬ 
drfa lislarcomo esencial la tolerancia hacia per¬ 
sonas diffeiles. Olro ejemplo: una description 
del puesto de oficial de poliefa podrfa cspccifi- 
car que la persona debe ser capaz de “Cargar a 
un individuo que ha sido arrestado y que no 
puede o se niega a caminar, al tomar a la perso¬ 
na por debajo dc los brazos, soportando su peso, 
y transportarla a la patrulla”, mientras que la 
correspondiente especificaciOn del puesto po¬ 
drfa referirse a un nivel mfnimo de fuerza y vi¬ 
gor ffsicos. En este caso se eslb adelantando a 
los hechos, pero incluso serfa posible poner en 
tbrminos operaciones el concepto dc "fuerza y 
vigor” como aquello que se requiere para arras- 
trar a un maniquf dc 55 kilos a una distancia de 
15 metros en un minuto (Arvcy, Landon, 
Nutting y Maxwell, 1992). 

La justification principal para el anblisis de 
puestos es que ayuda a proporcionar una base 
vblida para tomar dccisiones sobre el personal. 
Esto no sOlo cs dcscablc desde un punto de vis¬ 
ta btico, sino que tambibn satisface las normas 
legates decretadas por los tribunalcs y organis- 
mos reguladores. En el caso de Albemarle con¬ 
tra Moody (1975), la Suprcma Corte de EUA 
determi no que debe incluirse el anblisis de pues¬ 
tos en los estudios de validation que pretendan 
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demostrar una relacidn entre un instrument 
de scleccidn y cl desempefio en un puesto. Tam- 
bidn, las Uniform Guidelines on Employee 
Selection (1978) requieren del andlisis de pues- 
tos como un componentc de los cstudios sobrc 
validez. Como especifica Cascio (1987), justi- 
ficaciones adicionales para el andlisis de pues- 
tos incluycn: planificacidn dc los recursos de 
la organizacidn, entrenamiento y desarrollo del 
personal, scguridad y mejorfa de los mdtodos 
de trabajo e investigacidn sobre personal. 

Pucden utilizarse numcrosos mdtodos para 
realizar un anAlisis de puestos y un cxamen 
amplio nos llevarfa dcmasiado lejos. En pocas 
palabras, Cascio (1987) lista los siguicntes en- 
foques: 

• Observacidn directa de los titularcs del puesto. 

• Enlrevista estructuradu dc los trabajadores. 

• Recoleccidn de incidentes crfticos por parte 
de los supervisores. 

• Listas dc vcrificacidn de deberes y habilidadcs. 

• Cuestionarios. 

Otra fuente util de informacidn para cl andlisis 
de puestos es el Dictionary of Occupational 
Titles o DOT ( U.S. Department of Labor, 1991, 
1993). El DOT proporciona informacidn 
cstandarizada sobre la ocupaci6n para dar apo- 
yo a las actividades dc colocacidn en un em- 
plco. Por ejemplo, la espccificacidn del DOT 
para psicdmetra consiste de lo siguientc: 

045.067-018 PSIC6METRA (protes. y sim.) 

Aplica, calilica e interprota pruebas de inteligen- 
cia, aprovechamiento y otras pruebas psicolbgl- 
cas para proporctonar InformaciAn a maestros, 
orlentadores, estudiantes y otras partes Intere- 
sadas especificas. Aplica pruebas de lApiz y pa- 
pel o utilize equlpo de prueba, bajo condicionos 
estAndar. Crooometra, examina y reglstra los re- 
sultados. Interprota los resultados de prueba bajo 
normas estAndar y llmltaciones de prueba en tAr- 
minos de validez y conf iabrlrdad (U.S. Department 
ol Labor, 1991). 

El DOT tambidn proporciona informacidn la- 
boral pertincntc a la preparacidn educativa, dc- 


mandas ffsicas del trabajo y condiciones am- 
bientales que se enfrentan por lo general. P 0 r 
ejemplo, el puesto de psicdmetra requicre de 2 
a 4 ados de educacidn superior y se define como 
una ocupacidn sedentaria con frecuente nece- 
sidad de alcanzar, manejar, manipular y hablar. 
La buena audicidn y visidn cercana tambien se 
listan como caractcristicas ffsicas necesarias 
para el puesto (U.S. Department of Labor, 1993). 
El DOT cs una importante fuente de informa- 
cidn para el andlisis de puestos, en particular 
para los puestos tradicionales quc cstdn bien 
definidos. De mancra reciente, cl U.S. Department 
of Labor (Ministerio del Trabajo de EUA) co- 
mcnz.6 una ambiciosa iniciativa para analizar 
casi todos los puestos dcntro dc la economfa, 
segun el contenido o actividades laboralcs re- 
qucridas (Peterson, Mumford, Borman y otros, 
1995). La base de datos resultantc se denomina 
0*Net y promete ser muy valiosa para estable- 
cercorrespondencias entre personas y cmpleos. 

Pero no todos los puestos estdn definidos 
claramente, lo cual significa que puede ser ne- 
cesario que el psicdlogo I/O lleve a cabo un 
analisis formal dc puestos. Esto cs m£s diffcil 
de lo que podrfa parecer. Morgeson y Campion 
(1997) han resumido los escollos de un anilli- 
sis de puestos preciso, los cuales incluyen fac- 
tores sociales como la conformidad en los 
comitds de anAlisis de puestos y problemas con 
la sobrecarga dc informacidn quc sc dcriva de la 
complejidad de la tarea. En este caso se centra 
la atencidn sobre los cuestionarios para el an$- 
lisis dc puestos. dado que £stos hacen surgir 
varias cuestiones interesantes en cuanto a eva- 
luacidn. 

Los cuestionarios estructurados y cuantifi- 
cablcs para cl andlisis dc puestos no se volvie- 
ron populares sino hasta que el Position 
Analysis Questionnaire (PAQ; cuestionario dc 
andlisis dc puestos) aparecid a inicios del dc- 
cenio de 1970 (McCormick, Mccham y 
Jeanneret, 1972). Este instrumento introdujo un 
concepto novedoso “orientado al trabajador" 
accrca del anAlisis dc puestos, el cual permitfa 
que los psicdlogos I/O realizaran comparacio- 
nes significativas entre diferentes cmpleos. Aun 
popular hoy en dfa, el PAQ consiste de 194 
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teactivos oelementos del puesto que provienen 
de cinco catcgonas: 

• Obtencidn dc information: /,C6mo y dc d6n- 
de oblienc cl trabajador la informacidn ncce- 
saria para el pueslo? 

• Procesos mentales: ^Qud tipos de razona- 
miento, planificacidn y toma de dccisiones re- 
quiere el puesto? 

• Producto laboral: ^Cutties son las actividades 
ffsicas que sc llevan a cabo y las herramien- 
tas o instrumentos que utiliza el trabajador? 

• Relaciones personates: iQu6 tipos de rela- 
ciones con otras personas son inherentes al 
puesto? 

• Contexto del puesto: ^Cuiles son los con- 
textos fisicos y especiales en los que se lleva 
a cabo el trabajo? 

Algunos de los clemenlos individualcs del puesto 
simplcmcnle se marcan con “sf* o “no”, mienlras 
que otros rcactivos se califican en una escala 
apropiada como importancia, liempo odificultad. 
Por cjcmplo, en una subscccidn, el analista de 
puestos califica (en una escala de 1 a 5) cinco 
aspectos de la comunicaci6n oral (aconsejar, 
negociar, persuadir, ordenar y entrevistar) se- 
gun su importancia para un puesto especffico. 

El PAQ tiene una confiabilidad rcspetable 
cuando lo utilizan personas entrenadas para el 
anSlisis dc puestos. La confiabilidad intercalifi- 
cadores se coloca por lo comun alrededor del 
.80 para el instrumento en general (McCormick 
y cols., 1972; Mecham, McCormick y 
Jeanneret, 1977). Su validcz se ha establecido 
de mancra menos adecuada, aunque Cascio 
(1987) ha sefialado que el gdnero del analista, el 
nivel de interds de los titulares del puesto o la 
cantidad dc informacidn proporcionada accrca 
del puesto no afectan los resultados del PAQ. 
No obstante, el instrumento tiene limitaciones 
importantes, incluyendo cl elevado nivel de lec- 
tura que se requiere (posgrado universitario pa¬ 
ra algunos reactivos) e idoneidad limitada para 
puestos profesionalcs y gerenciales. Quizes una 
limitacidn mds grave es que el dnfasis en los 
uspectos conductuales del trabajo puede pasar 
por alto importantes diferencias en tareas entre 
puestos sumamente diferentes. Por ejemplo. 


Arvey y Bcgalla(1975) han senalado que cl per- 
fil de un oficial de poliefa es bastanlc similar a] 
de una ama de casa. Por ejemplo, ambos pucs- 
tos pueden implicar resolucidn de conflictos 
—pero en contextos sumamente diferentes. 

En respuesta a las dcficicncias percibidas 
en el PAQ, Cornelius y Hake! (1978) desamo- 
llaron el Job Element Inventory, JEI (Inventa- 
rio de elementos del puesto). Similar en formato 
al PAQ, el JEI consiste dc 153 reactivos con un 
nivel dc lectura de educacidn secundaria. La 
innovacidn mds significativa es que cl instru¬ 
mento tiene la suficiente sencillez como para 
que lo llenen los titulares del puesto. Dado que 
no sc requiere de personas entrenadas en andli- 
sis de puestos, el JEI es sumamente eficiente 
en cuanto a costos. En un cstudio analftico 
factorial del JEI con 2 000 titulares de puestos 
en la Guardia Costcra, Harvey, Friedman. Hakel 
y Cornelius (1988) descubrieron que los facto- 
res del JEI ticnen un estrccho paralelo con los 
del PAQ. El primero parece lograr las mismas 
metas que el segundo, pero con mayor veloci- 
dad y cficiencia. 

En ados recientes han aparecido varios 
cuestionarios estandarizados dc andlisis de 
puestos, como se analiza en el cuadro 11-2. En 
realidad, cstos instrumentos aun estdn en su 
infancia. Sin embargo, con las reglamentacio- 
nes externas y la amcnaza de las demandas por 
discriminacidn que siempre merodean en el 
ambiente, podemos predecir con confianza que 
los cuestionarios de andlisis de puestos se vol- 
verdn algo comun —al menos dentro de gran- 
des corporacioncs que deben asignar diversos 
empleados a cargos especfficos. 

■ FUNCION DE LAS PRUEBAS 
EN LA SEIECCI6N DE PERSONAL 


COMPLEJIDADES DE LA SELECabN 
DE PERSONAL 

Con base en la suposicidn dc que las pruebas y 
evaluacioncs psicoldgicas puedan proporcionar 
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Cuadro 11-2. Cuestionarios de anallsis 
de puestos 


Professional and Managerial Position Ques¬ 
tionnaire (PMPQ-, Cuestionarlo de Puestos 
Profesionales y Gerenciales) 

(Mitchell y McCormick, 1979) 

Un instrumento orientado a la gerencla que evalua 
aclividades interpersonales, planificacidn y toma 
de decisiones, procesamiento de Informacidn, 
aclividades lecnicas y factores antecedentes que 
constiluyen requisltos previos como experiencia 
relacionada, entrenamiento especial y uso de un 
segundo idioma. 

Occupation Analysis Inventory (OAh, Invents- 
Ho de Andlisis Ocupacional) 

(Cunningham, Boese, Neeb y Pass, 1983) 

Un instrumento de 617 reactivos con propdsitos 
generates que evalua aclividades bioldgicas/ 
relacionadas con la salud, aclividades botanicas, re- 
paracidn eldctrica-electrdnica, trabajo con ani- 
males y preparacldn/procesamiento de alimentos. 

General Work Inventory (GWI\ Inventario de 
Trabajo General) 

(Cunningham y Ballentine, 1982) 

En esencia es una forma corta del Inventario de 
andllsls ocupacional que evalua constmctos labo- 
rales similares. 

Common Metric Questionnaire (CMQ-, Cues- 
tionario Metrico Comun) 

(Harvey, 1990) 

El CMQ se dlsefid para aplicarse a todos los em- 
pleos; incluye escalas con referenda conductual, 
de modo que las calificaciones signiftcan lo mismo 
entre diferentes puestos; por ejemplo, las interaccio- 
nes con otras personas podrian calificarse en; coor- 
dinar/programar sus aclividades, convencertos o 
persuadirtos, entrenartos/instruirlos/educarlos. 


informacidn valiosa sobre cl dcscmpeno potcn- 
cial en el trabajo, muchos negocios, empresas 
y ambientes militares han utilizado las puntua- 
ciones de prueba y los resultados de evaluacidn 
para la selcccidn de personal. Como ha sefiala- 
do Guion (1991), la investigacidn I/O sobre 
selcccidn de personal ha enfatizado la validez 
relacionada con el criterio cn contraposicidn con 
la validez de contenido o de constructo. Estos 


otros enfoques hacia la validez son, con toda 
seguridad, pertinentes, pero en general toman 
una posicidn subordinada con respecto a la va¬ 
lidez relacionada con cl criterio, que prcdica 
que los resultados actuates de la evaluacidn 
deben predecir el futuro criterio de dcscmpeno 
en el cargo. 

Dcsde el punto dc vista de la validez rela¬ 
cionada con el criterio, la Idgica de la seleccidn 
dc personal es atractivamentc sencilla. Ya sea 
en grandes empresas o en pequefios negocios, 
aquellos que seleccionan a los emplcados dc- 
berfan utilizar pruebas o evaluaciones que ten- 
gan correlaciones documentadas y fucrtes con 
el criterio del desempcfio en cl puesto y des¬ 
puds contratar a individuos que obtengan las 
puntuaciones mils alias cn la prueba o que mucs- 
trcn los resultados mds fucrtes cn la evaluacidn. 
iQud podrfa ser mds sencillo que esto? 

Por desgracia, la aplicacidn en la vida real 
de los procedi mientos de selcccidn de perso¬ 
nal estd plagada de complejidadcs psicomdtricas 
y escollos legales. Las complicaciones psicomd- 
tricas surgen, en gran medida, del hccho de que 
la conducta laboral es, en pocas ocasiones, una 
conducta sencilla y unidimensional. Existcn 
algunas excepcioncs (como la produccidn en 
una linea dc cnsamblado), pero la regia general 
en nuestra sociedad posterior a la industrializa- 
cidn es que la conducta laboral es compleja y 
multidimensional. Incluso los empleos que pa- 
recen sencillos pueden ser sumamentc comple- 
jos. Por ejemplo, considdrcse aqucllo que se 
requicre para el desempedo eficaz en la entre- 
ga de correo en EUA. El individuo que lleva cl 
corrco seis dfas por semana debe hacer mds que 
simplementc colocarlo cn el buzdn. Esta per¬ 
sona debe clasificar de manera precisa y sobre 
la marcha el correo. interpretar e imponer los 
reglamentos del gobiemo acerca del tamano de 
los paquetes, manejar animales molestos c in¬ 
cluso peligrosos, reconocer y evitar peligros 
ffsicos y ejercer habilidades interpersonales efl- 
caces para tratar con el publico; por citar sdlo unas 
cuantas de las complejidades de estc puesto. 

Por tanto, la selcccidn dc personal es una 
tarea confusa, condicional e incierta. Guion 
(1991) ha destacado la dificultad para predecir 
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la conducta compleja a partir de pruebas sim¬ 
ples. En primer lugar, la conducta compleja estd, 
en parte, en funci6n de la situacidn. Esto signi- 
fica que es posible que incluso un enfoque 6p- 
timo para la selcccidn no sea vdlido para todos 
los candidatos. Es bastante claro que la selecci6n 
de personal no es una simple cuestidn de apli- 
car pruebas y consultar puntuaciones de corte. 

Se debe reconocer tambien el profundo 
impacto de los edictos legates y reglamentarios 
sobre las prdcticas de prueba I/O. Dado que 
dichas practicas pueden tener consecuencias 
serias —por ejemplo, la dcterminacidn de a 
quidn sc contrata o se asciende— no causa sor- 
presa enterarse que los precedentcs legalcs y 
los decretos de regulacidn restringen de manc- 
ra estricta las prdclicas de prueba I/O. En la 
seccidn final de este capftulo sc revisan estas 
cuestiones. 


ENFOQUES PARA LA SELECC)6N 
DE PERSONAL 

En reconocimiento de que la entrevista es una 
forma ampliamente utilizada de evaluacidn de 
personal, es adecuado concluir que la cvalua- 
ci6n psicoldgica es casi una prdctica universal 
en las decisioncs de contratacidn. Incluso a par¬ 
tir de una definicidn cstrecha que incluya sdlo 
medidas de Idpiz y papel, cuando menus dos 
terceras partes de las companfas en EUA parti- 
cipan en cxdmenes del personal (Schmitt y 
Robertson, 1990). Para propdsilos de seleccidn 
de personal, el psicdlogo I/O puede recomcn- 
dar uno o mds de los siguientes clementos: 

• Datos autobiogrdficos. 

• Entrevista de cmpleo. 

• Pruebas de capacidad cognitiva. 

• Pruebas de personalidad, temperamento y 
motivacidn. 

• Pruebas de integridad de Idpiz y papel. 

• Pruebas sensoriales, ffsicas y de destreza. 

• Muestra de trabajo y pruebas situacionales. 

Sc volverd ahora la atcncidn a un andlisis bre¬ 
ve de las pruebas y enfoques de evaluacidn tf- 


picos dentro de cada una de estas categorfas. 
Se cierra el tema con una discusion accrca de 
las cuestiones legales en los exdmencs de per¬ 
sonal. 


M DATOS AUTOBIOGRAfICOS 

Segun Owens (1976), las formas de solicitud 
de cmpleo que requieren de los antccedcntes 
personates y laborales asf como de datos dc- 
mogrdficos como edad y estado civil, se han 
utilizado en la industria desde 1S94. Por lo co- 
mu n, los datos autobiogrdficos objetivos o ca- 
lificables —llamados en ocasiones datos 
biograficos— se obtienen por medio de un for- 
mato estructurado que de manera diversa se ha 
llamado formulario de informacidn biogrdfica, 
forma de datos biogrdficos, formulario de 
solicitud, gufa de entrevista, encuesta de ante- 
cedcntes individuals o algun instrumento si¬ 
milar. Aunque es posible que cl ptiblico lego no 
reconozca estos instrumentos como verdade- 
ras pruebas con poder de prcdiccidn, los psi- 
cdlogos I/O han sabido desde hace algun liempo 
que los datos biograficos proporcionan una base 
cxcepcionalmentc podcrosa para la prediccidn 
del desempeiio del empleado (Drakeley, Hcrriot 
y Jones, 1988; Cascio, 1976; Ghiselli, 1966; 
Hunter y Hunter, 1984; Reilly y Chao, 1982). 
Un hito importante en cl enfoque de los datos 
biograficos es la reciente publicacidn del 
Biodata Handbook, un detallado estudio sobre 
la utilizacidn de la informaci6n biogrdfica en la 
seleccidn y en la prediccidn del desempeno 
(Stokes, Mumford y Owens, 1994). 

La fundamentacidn para el enfoque de los 
datos biograficos es que puede predecirse la 
conducta futura rclacionada con el trabajo a 
partir de las elecciones y logros pasados. Los 
datos biograficos tienen poder de prediccidn 
debido a que ciertos rasgos de car&cter que son 
esenciales para el 6xito tambien son cstables y 
duraderos. Es probable que el joven consisten- 
temente ambicioso que ha obtenido distincio- 
nes y logros en el bachillcrato, continue con 
este patron hasta su adultez. Asf, el solicitante 
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de empleo quc ha fungido como editor de un 
pcribdico cscolar en bachillerato —y quc res- 
pondc a un reactivo de datos biogrdficos sobre 
esta cuestibn— con toda probabilidad es un 
mejor candidato para la gerencia de una em- 
presa que aquel que no informa actividades 
extracurricularcs cn un formato de datos bio¬ 
grdficos. 

NATURALEZA DE LOS DATOS 

biogrAficos 

En general, los datos biogrdficos demandan 
datos “objetivos"; no obstante, en ocasiones se 
incluyen reactivos quc dctectan actitudcs, scn- 
timientos y juicios de valor. Excepto por datos 
demogrdficos como edad y estado civil, los 
reactivos de datos biogrdficos siempre se refie- 
ren a logros y acontecimicntos pasados. Ejem- 
plos de preguntas de este tipo incluyen el mayor 
nivel educativo obtenido, numero de prcmios o 
reconocimicntos especiales, ingresos en un em¬ 
pleo previo, numero de empleos desempefia- 
dos en los ultimos 10 afios, extensibn de tiempo 
cn la presentc dircccibn, numero de publica- 
ciones y de proyectos dirigidos en los ultimos 
cinco afios. 

Una vez que se obticnen los datos biogrdfi- 
cos, cl psicblogo I/O debe disehar un medio 
para predecir el desempcfio laboral a partir de 
esta informacibn. La estrategia mis cornu n es 
una forma de codificacibn empirica no muy 
diferente de la que se utiliza en las prucbas de 
pcrsonalidad. A partir de una muestra grande 
de trabajadores ya contratados, el psicblogo I/O 
designa a un grupo exitoso y a uno que no lo es 
con base en el desempcfio, puesto, salario o 
calificaciones del supervisor. Entonces, se con- 
trastan los datos biogrdficos individuates para 
estos dos grupos, a fin de determinar cudlcs 
reactivos discriminan de manera mas precisa 
cntrc trabajadores exitosos y los que no lo son. 
Los reactivos que tienen un fuerte poder de dis- 
criminacibn reciben ponderaciones elevadas en 
el esquema de puntuacibn. Por tanto, los nue- 
vos solicitantes que responden a los reactivos 
en la direccibn codificada reciben puntuacio- 


ncs alias en el instrumento de datos biogrdficos 
y sc predicc que tcndrdn dxito. La validacibn 
cruzada del esquema de puntuacibn en una se- 
gunda muestra de trabajadores exitosos y no 
exitosos es un paso crucial para garantizar la 
validez del mbtodo de seleccibn con datos 
biogrdficos. Los lectores que descen tener ma- 
yores detalles sobre los mbtodos de codifica- 
cidn empirica para los instruments de datos 
biogrdficos dcbcrdn consultar a Murphy y 
Davidshofer (1988) y Stokes y colaboradores 
(1994). 

VAUDEZ DE LOS DATOS BIOGRAFICOS 

Varios investigadores han examinado la vali¬ 
dez de los datos biogrdficos y han llegado en 
general a conclusioncs positivas (Mumford y 
Owens, 1987; Reilly y Chao, 1982; Rothstein, 
Schmidt, Erwin, Owens y Sparks, 1990; Russell, 
Mattson, Devlin y Atwater, 1990; Stokes y cols., 
1994). Uno de los primeros estudios de Cascio 
(1976) es tfpico de estas conclusiones. Este 
investigador ulilizb un instrumento muy senci- 
llo de datos biogrdficos —una combi naci bn pon- 
derada de 10 reactivos de un formulario de 
solicitud de empleo— para predecir la rotacibn 
del personal secretarial femenino en una com- 
pafifa de scguros de mcdiano tamafio. Las co- 
rrelaciones por validacibn cruzada entre las 
calificaciones cn datos biogrdficos y la dura- 
cibn en el puesto fueron de .58 para miembros 
de minorfas y de .56 para personas no pertene- 
cientcs a cllas.* Drakeley y colaboradores 
(1988) hicieron una comparacibn cntrc datos 
biogrdficos y pruebas de capacidad cognitive 
como medios de prediccibn del bxito del entre- 
namiento. Las calificaciones de datos biogrdfi- 


* El lector inleresado podria quercr saber cudlcs 10 
reactivos de dalos biogrdficos poscen lal poder de 
prcdicci6n. Estos fueron edad, cslado civil, edad 
de los hijos, cducacibn, puesto en cl empleo anterior, 
salario previo, amigo o familiar cn la compafifa. lugar 
de residencia, poscsibn de casa propia y extension de 
tiempo cn la presente direccidn. Por desgracia, Cascio 
(1976) no rcvcla las ponderaciones relativas o direc¬ 
cidn de calificacidn para los reactivos. 
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cos tuvicron la misma validez prcdictiva que 
las pruebas cognitivas. Lo que es mils, cuando 
se anadid a la ecuacidn de rcgresidn la informa- 
cidn de los datos biogr&ficos mejord la preci- 
sidn prcdictiva de las pruebas cognitivas. 

En un extenso estudio de investigacidn. 
Reilly y Chao (1982) compararon ocho proce- 
dimicntos de seleccidn en cuanto a validez y al 
impacto adverse) sobre las minorfas. Los procc- 
dimientos fueron datos biogr&ficos, valoracidn 
dc compaheros, entrevistas, autocvaluaciones, 
verificaciones de credenciales. logros acaddmicos, 
juicios dc expertos y tdcnicas proyeclivas. Sin 
dejar dc scfialar que las pruebas dc capacidad 
con estandarizacidn adecuada proporcionan el 
procedimiento mds equitativo y vdlido de selec- 
cidn, Reilly y Chao (1982) concluyeron que sdlo 
los datos biogrdficos y las valoraciones de 
companeros tem'an validez sustancial igual a 
aqucllas de las pruebascstandarizadas. Porejem- 
plo, en la prediccidn de la productividad en ven- 
tas, el coeficicntc promedio de validez dc los 
datos biogrdficos fuc un muy robusto .62. 

Es ncccsario mencionar ciertas adverten- 
cias con rcspecto a los enfoques de datos bio- 
graficos en la selecci6n de personal. Es posible 
que la ley le prohfba a los emplcadores hacer 
pregun tas sobre edad, raza, sexo, religidn y otras 
cucstiones personates —incluso si se puede 
demostrar a nivel empfrico que dichos datos 
prcdiccn el dcsempeho en el puesto. Tambidn, 
aunque la incidencia de engano es muy baja, 
no hay duda que los solicitantes astutos pue- 
den adultcrar los resultados en una direccidn 
favorable. Como ocurre con cualquier instru- 
mento de medici6n, los reactivos de datos bio- 
grdficos requerirdn una reestandarizacidn 
periddica. Por ultimo, un inconvenicntc polcn- 
cial del enfoque dc datos biogrdficos es que, 
por su misma naturalcza, este mdtodo captura 
cl status quo de la organizacidn y, por tanto, 
podrfa anular la innovacidn. Becker y Colquitt 
(1992) analizan las prccauciones en el desarro- 
llo de los formatos de datos biogrrificos. 

Por tanto, existen pocas dudas acerca de 
que la informacidn puramente objetiva de los 
datos biogrdficos puede predecir aspectos del 
desempeiio laboral con bastante precisidn. No 


obstante, es mds probable que los cmpleadorcs 
dependan de la informacidn subjetiva como las 
imprcsioncs de entrevista cuando toman deci- 
siones sobre contratacidn. A continuacidn sc 
vuelve la atencidn hacia la investigacidn sobre 
la validez de la entrevista de trabajo en el pro- 
ceso dc seleccidn. 


j ENTREVISTA DE TRABAJO 

En general, la entrevista dc trabajo es sdlo una 
parte del proceso de evaluacidn, pero la mayo- 
rfa de los administradores la consideran como 
el componcntc crucial y definitorio de la con¬ 
tratacidn (Miner y Miner, 1978). Landy (1985) 
informa que, por lo comun, las companfas 
entrevistan jde 5 a 20 personas porcada indivi- 
duo que contratan! Si se considera la imporlan- 
cia de la entrevista y su terrible costo para la 
industria y las profcsioncs. el lector no debe- 
rfa sorprenderse de saber que miles dc cstudios 
tratan sobre la confiabilidad y validez de la 
misma. En este libro sdlo pueden destacarse 
unas cuantas tcndcncias; pueden encontrarse re¬ 
sedas mds detalladas en Conway. Jako y 
Goodman (1995), Landy (1985), y Schmitt 
y Robertson (1990). 

Los primeros estudios sobre la confiabilidad 
dc la entrevista fueron bastante aleccionadores. 
En diversos estudios y resedas, la confiabilidad 
se evaluaba por lo comun al correlacionar las 
valoraciones de diferentes entrevistadores que 
tuvieron acceso a los mismos candidatos para el 
empleo (Wagner, 1949; Mayfield, 1964; Ulrich 
y Trumbo, 1965). La confiabilidad internal ifica- 
dores de docenas de estos primeros estudios se 
eoloed por lo comun a la mitad del rango de 
.50, un nivel muy bajo como para proporcionar 
evaluaciones precisas de los candidatos al em¬ 
pleo. Esta investigacidn tambidn reveld que los 
entrevistadores estaban propensos a una pre- 
disposicidn dc halo y otras influencias distorsio- 
nantes en sus perccpcioncs de los candidatos. 
La predisposicidn de halo —la cual se analiza 
en el siguiente tema— es la tcndcncia a clasifi- 
car a un candidato en un nivel alto o bajo en 





486 • Evaluation psicoldgica: Historia, principios y aplicaciones 


(Capilulo 11) 


todas las dimensiones debido a una impresidn 
global. 

Posteriormentc, los investigndores descu- 
bricron que la confiabilidad dc la cntrevista 
podfa incrcmcntarse a nivcl sustancial si dsta la 
ilevaba a cabo dc manera conjunla un panel, en 
vez de un solo entrevistador (Landy, 1985). 
Adem6s, las entrevistas estructuradas cn las que 
cada entrevistador le hacfan las mismas prcgun- 
tas a cada entrcvistado tambidn resultaban mucho 
mis conftables que aqudllas no estructuradas 
(Borman, Hanson y Hedge, 1997; Campion. 
Pursell y Brown, 1988). En estos cstudios se 
encontraron confiabilidades en el rango de .70 
y superiores. 

La investigacidn sobre la validcz de la en- 
trevista ha seguido el mismo curso evolutivo 
que se sciiala para la confiabilidad: las prime- 
ras investigacioncs que examinaron las entre- 
vistas no estructuradas fueron bastante pcsi- 
mistas, mientras que la investigacidn posterior 
con enfoques estructurados produjo conclusio- 
ncs mis prometedoras. En estos estudios, la 
validez de la entrevista se evalud de manera tf- 
pica al correlacionar los juicios de entrevista 
con alguna medida del desemperto cn el pues- 
to. Los estudios iniciales sobre la validez de la 
entrevista produjeron pdsimos resultados casi 
de manera uniforme, con coeficientes tfpicos de 
validez que rondaban la parte media del .20 
(Arvey y Campion, 1982). 

Tomando cn cucnta que las entrevistas rara 
vez se utilizan de manera aislada, los primeros 
investigadorcs tambidn analizaron el incremcn- 
to en la validez, que es el aumento potencial en 
dsta cuando la entrevista se utiliza junto con 
otra informacidn. Estos estudios sc fundamen- 
taron en la suposicidn optimista de que la en¬ 
trevista contribuirfa de modo positivo a la 
valoracidn del candidato cuando se le utilizara 
junto con punluaciones de pruebas objetivas y 
datos sobre antecedentcs. Por desgracia, las 
conclusiones iniciales fueron contrarias a esta 
suposicidn casi porcompleto (Landy, 1985). 

En algunos casos, los inlentos por probar cl 
incremento en la validez de la entrevista demos- 
traron justo lo contrario, lo que podrfa llamarse 
decremento en la validcz. Por ejemplo, Kelly y 
Fiske (1951) establecieron que la informaci6n 


de entrevista de hecho disminuta la validez de 
las valoraciones de estudiantes de posgrado. En 
este primer estudio cllsico, la tarea consistfa 
en predecir el desempeno acaddmico de m4s 
de 500 estudiantes del posgrado en psicologfa. 
Sc utilizaron di versas combinaciones de crcdcn- 
ciales (una forma de datos biogrificos), cali- 
ficaciones en pruebas objetivas y entrevistas, 
como base para las predicciones clfnicas del 
desempeno acaddmico. En cl cuadro 11-3 sc 
presentan los coeficientes de validez. El lector 
observard que las credenciales por sf solas pro- 
porcionaron una base mucho mejor para la pre- 
diccion, que dstas mds una entrevista dc una 
hora. Los mejores medios de prcdiccidn sc ba- 
saron cn las credenciales y las calificaciones 
en pruebas objetivas; dc hecho, ahadir una entre¬ 
vista de dos horas a esta informacidn disminufa 
la precisidn de las predicciones. Estas conclu¬ 
siones destacaron la superioridad de la predic- 
ci6n actuarial (basada en fdrmulas obtenidas de 
modo empfrico), por encima de la prediccidn 
clfnica (basada cn impresiones subjelivas). En 
el ultimo capftulo de este libro sc sigue este 
debate enlre el enfoque actuarial y cl clfnico. 

Los estudios recientes que utilizan entre¬ 
vistas cuidadosamcnte estructuradas, incluyen- 
do entrevistas situacionales, proporcionan una 


Cuadro 11-3. Coeficientes de validez 
para las clasificaciones con base en 
diversas combinaciones de informaclon 


Base para la 
clasiflcacidn 

Correlacidn 
con el 
desempeho 
academlco 

Credenciales por si solas 

.26 

Credenciales y una hora de en¬ 
trevista 

.13 

Credenciales y punluaciones de 
prueba objetiva 

.36 

Credenciales, puntuaciones de 
prueba y dos horas de entre¬ 
vista 

.32 


Fuente: Basado en datos d« Ke«y. E L, y Fiske. D W. (1951) 
The prediction ot performance in clinical psychology. Ann Art** 
University ot Michigan Press 
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imagen mis positiva de la validez de la entre- 
vista (Borman. Hanson y Hedge. 1997; Maurer 
yFay, 1988; Schmitt y Robertson. 1990). Cuan- 
do se corrigen las conclusioncs en cuanto a res- 
triccidn de rango y falta de confiabilidad de las 
calificaciones del desempefio en el puesto, el 
coeficiente medio de validez para las cntrevis- 
tas estructuradas resulta ser un impresionante 
.63 (Wicsnery Cronshaw, 1988). En un recicn- 
te mctaanilisis, Conway. Jako y Goodman 
(1995) concluyeron quc el Ifmite superior para 
cl coeficiente de validez dc las entrevistas cs- 
tructuradas era .67, nticntras que para las no 
estructuradas el coeficiente de validez era de 
solo .34. Razoncs adicionales para prefcrir las 
entrevistas estructuradas incluyen sus posibili- 
dadcs de defcnsa legal en caso de una dcmnnda 
(Williamson. Campion, Malo y colaboradores, 
1997) y, para gran sorpresa, su minima pre- 
disposicidn entre difercntcs grupos racialcs de 
solicitantes (Huffcutt y Roth, 1998). 

A fin de llegar a niveles aceptables de con¬ 
fiabilidad y validez, las entrevistas estructuradas 
deben discrfarsc con cuidadoso esmcro. Consi- 
ddresc el protocolo que utilizaron Motowidlo y 
colaboradores (1992) en su investigacidn so- 
bre entrevistas estructuradas para los puestos 
gerenciales y de mcrcadotecnia en ocho com- 
pant'as de telecomunicacioncs. Su formato dc 
cntrevista se bas6 en cuidadoso anilisis dc inci- 
dentes crfticos en mercadotccnia y gerencia. A 
los posibles empleados se les hizo un conjunto 
de preguntas estindar sobre la mancra en que 
habi'an manejado situaciones pasadas similares 
a cstos incidentcs crfticos. Los entrevistadores 
cstaban entrenados para hacer preguntas in- 
dagatorias discrecionalcs acerca de los detallcs dc 
la manera en que los solicitantes habfan ma¬ 
nejado estas situaciones. A lo largo de la entre- 
vista, los entrevistadores tomaron copiosas 
notas. Despuds, se calificd a los solicitantes en 
escalas vinculadas con ejemplos conductuales. 
Por ultimo, sc combinaron estas calificaciones 
para producir una puntuacidn total de entrevista 
que sc utilizd en las dccisioncs de seleccidn. 

En resumcn, bajo condiciones cuidadosa- 
mentedisenadas, la entrevista puede proporcio- 
nar una base confiablc y vdlida para la selecci6n 


dc personal. Sin embargo, como scnalan 
Schmitt y Robertson (1990), no siempre estdn 
disponibles las condiciones previas indispen- 
sables para la validez de la entrevista. El pro- 
blema esencial es que es posible que cada 
entrevistador valore s6lo a un pequefio numcro 
de solicitantes, de modo que la estandariza- 
ci6n de sus calificaciones no siempre es rcalis- 
ta. Aunque la entrevista tienc un potencial de 
ser valida como tdcnica de seleccidn, en su apli- 
cacidn comtin, no estructurada, es probable que 
cxista raz6n sustancial para preocuparsc. 

i,Por qud se ulilizan las entrevistas? Si la 
entrevista tfpica, no estructurada, es tan poco 
confiablc e ineficaz como base para la valora- 
cidn de un candidato a un empleo, £por que los 
administradores continuan tenidndola en tan alta 
cstima? En su revisidn sobre la entrevista de 
trabajo, Arvey y Campion (1982) destacan va- 
rias razones para la persistence de la entrevis¬ 
ta, incluyendo consideracioncs prdcticas como 
la necesidad dc convencer al candidato de las 
ventajas del empleo y razones sociales como la 
susceptibilidad de los entrevistadores a la ilu- 
si6n de validez personal. Otros han enfatizado 
la importance de la entrevista para evaluar una 
buena correspondence entre el solicitante y la 
organizacidn (Adams, Elacqua y Colarelli, 
1994; Latham y Skarlicki, 1995). 

Es diffcil imaginar que alguna vez la ma- 
yorfa de los empleadores pudieran eliminar por 
completo la entrevista del proceso de investi- 
gacidn y seleccidn. Despuds de todo, la enlre- 
vista sf satisface la simple necesidad humana 
de conoccr a las personas que podrfan contra- 
tarse. No obstante, con base en 50 aiios de in- 
vestigacidn, es evidente que, a menudo, los 
datos biognSficos y las pruebas objetivas pro- 
porcionan un fundamento mds poderoso para 
la valoracidn y seleccidn del candidato que las 
entrevistas estructuradas. 


B PRUEBAS DE CAPACIDAD 

COGNmVA 

— -- 

La capacidad cognitiva puede referirse ya sea a 
un conslructo general semejante a la inteligen- 
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cia o a una variedad de consiructos especfft- 
cos como habilidadcs verbales, capacidad numd- 
rica, percepcidn espacial o velocidad perceptual 
(Kline, 1993). Las pruebas dc capacidad cog- 
nitiva general y las medidas dc habilidades cogni- 
tivas especfficas tiencn muchas aplicacioncs cn 
la seleccidn, valoracidn e investigacidn dc per¬ 
sonal. Dichas pruebas son rdpidas, de bajo cos- 
to y fdciles de interprclar. Un amplio conjunto 
de investigacidn empfrica ofrece un apoyo mo- 
desto, pero fuerte, para la validez y equidad de 
las pruebas cstandarizadas de capacidad en la 
seleccidn dc personal (Gottfredson, 1986). Con 
seguridad, parcce claro que a mcnudo las prue¬ 
bas dc capacidad proporcionan una base exce- 
lcnte para la seleccidn para un puesto, al menos 
segun criterios objetivos como la capacidad para 
prcdecir el dcscmpeno en un empleo. Por ejem- 
plo. Hunter y Hunter (1984) llevaron a cabo un 
metaandlisis de la investigacidn sobre la pre- 
diccidn del desempcno en el puesto y conclu- 
yeron quc, para empleos de primer ingreso, no 
existe ningiin medio de prcdiccidn (exccpto por 
la muestra dc trabajo) quc supcrc la validez de 
las pruebas de capacidad, las cuales mostraron 
un cocficicnte medio de validez de .54. 

Un debate continuo dentro de la psicolo- 
gfa I/O es si la evaluacidn para el empleo se 
logra mejor con pruebas sumamente espeeffi- 
cas de la capacidad o con medidas de capaci¬ 
dad cognitiva general. La mayor parte dc la 
cvidencia parece sustentar la conclusidn de que 
un factor general dc inteligencia (el llamado fac¬ 
tor g) es, en tdrminos generales, un mejor me¬ 
dio de prcdiccidn del dxito en el entrenamiento 
y cn el trabajo que las calificacioncs en medi¬ 
das cognitivas cspccfficas—aun cuando se uti- 
licen de manera combinada varias medidas 
cognitivas especfficas. Por supuesto, csta con¬ 
clusidn es contraria al sentido comun y a la evi- 
dencia anecddtica. Por ejemplo, Kline (1993) 
ofrcce la siguiente estampa: 

La cuestttn es que los (adores g son importan- 
tes, pero tambi6n lo son estos otros (adores. Por 
ejemplo, una g elevada es necesaria para ser un 
buen ingeniero o un buen perlodista. Sin embar¬ 
go, la elevada capacidad especial tambidi es 
requisito para el primero, miontras que es un (ac¬ 


tor que conliere pocas vonlajas para un perlo¬ 
dista. No obstante, para este ultimo la elevada 
capacidad verbal es obviamente util. 

Curiosamente, la investigacidn empfrica pro- 
porciona solo un apoyo dispar para esta postura 
(Gottfredson, 1986; Larson y Wolfe, 1995; Rce, 
Earles y Tcachout, 1994). Aunque el tema con- 
tinua cn debate, la mayor parte dc los esludios 
sustenta el papel primordial dc g cn la sc!ecci6n 
de personal (Borman y col., 1997). Quizd la ra- 
zdn por la quc, cn general, g funciona mejor 
quc los factores cognitivos especfficos en la prc¬ 
diccidn del desempcno en cl puesto, es quc la 
mayor parte de dstos son factorial mente comple- 
jos cn cuanto a sus rcquisitos, a despecho de los 
estercotipos (Guion, 1991). Por ejemplo, el in¬ 
geniero exitoso debe explicar sus ideas a otras 
personas y, por tanto, nccesita de capacidad 
verbal asf como de habilidades cspacialcs. Dado 
que las medidas de capacidad cognitiva general 
detectan muchas habilidades cognitivas espe¬ 
cfficas, a menudo una prueba general prcdice cl 
desempeno en trabajos complejos tan bien o me¬ 
jor quc las medidas dc habilidades especfficas. 

Literalmente cientos de pruebas de capacidad 
cognitiva estdn disponibles para la seleccidn de 
personal, de modo que no es factiblc analizar 
aquf cl rango complcto dc instrumentos. En vez 
dc ello, se dcstacardn tres pruebas representali- 
vas: una que mide capacidad cognitiva gene¬ 
ral, otra quc guarda relation con la evaluaci6n 
de capacidadcs mccdnicas, y una tercera que se 
dirige a una faceta sumamente especffica del 
trabajo de oftcina. Los tres instrumentos clegi- 
dos para revisidn —la Wonderlic Personnel 
Evaluation (Evaluacidn Wonderlic de Personal), 
la Bennett Mechanical Comprehension Test 
(Prueba Bennett de Comprensidn Mccdnica) y 
la Minnesota Clerical Test (prueba Minnesota 
de Trabajos de Oftcina) —son sdlo ejemplos dc 
los miles de pruebas de capacidad cognitiva 
disponibles para la seleccidn de personal. Con 
frecuencia las tres pruebas sc utilizan en am- 
bientes de ncgocios y, por tanto, merecen co- 
mentario especfftco. En el cuadro 11-4 se 
muestran pruebas represenlativas de capacidad 
cognitiva que se encuentran en la seleccidn de 
personal. Algunas perspectivas cldsicas sobre 
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Cuadro 11-4. Pruebas representativas 
de capacidad cognitiva que se utilizan 
en la seleccion de personal 


Pruebas de capacidad general 

Shipley Institute olLiving Scale (Escala del Shipley 
Institute of Living) 

Wonderlic Personnel Evaluation (Evaluacidn 
Wonderlic de Personal) 

Wesman Personnel Classification Test (Prueba 
Wesman de clasificacibn de personal) 

Personnel Tests for Industry (Pruebas de personal 
para la industria) 

Baterfas de prueba de aptitudes multiples 

General Aptitude Test Battery (Bateria de pruebas 
de aptitud general) 

Armed Services Vocational Aptitude Battery (Bate¬ 
ria de aptitudes vocacionales de las fuerzas armadas) 
Test de aptitudes dilerenciales 
Employee Aptitude Test (Prueba de aptitud del 
empleado) 

Pruebas de aptitudes mecinicas 

Bennett Mechanical Comprehension Test (Prueba 
Bennett de comprensibn mecAnica) 

Minnesota Spatial Relations Test (Prueba Minne¬ 
sota de relaciones espaciales) 

Revised Minnesota Paper Form Board Test 
(Prueba revisada Minnesota de tablero con formas 
de papel) 

SRA Mechanical Aptitudes (Aptitudes mecanicas SRA) 
Pruebas de capacidad motora 
Crawford Small Parts Dexterity Test (Prueba 
Crawford de destreza con pequenas piezas) 

Test no verbal de la Universidad de Purdue 
Hand-Tool Dexterity Test (Prueba de destreza 
manual oon herramientas) 

Stromberg Dexterity Test (Prueba Stromberg de 
destreza) 

Pruebas para trabajos de oficina 

Minnesota Clerical Test (Prueba Minnesota de 
trabajos de oficina) 

Clerical Abilities Battery (Bateria de capacidades 
para trabajos de oficina) 

General Clerical Test (Prueba general de trabajos 
de oficina) 

SRA Clerical Aptitudes (Aptitudes para trabajos 
de oficina SRA) 

NoU: SRA denote Science Research Associates Estes pruebas 
se revlsan en la serie Mental Measurements Yearbook 


el cxamen de la capacidad cognitiva pucden lo- 
calizarse en Ghiselli (1966,1973); Guion (1991), 
Hunter y Hunter (1984) y Reilly y Chao (1982). 
Borman y colaboradorcs (1997) y Murphy 
(1996) proporcionan un an&lisis actual sobre 
este tema. 


PRUEBA WONDERLIC DE PERSONAL 

Aunquc se le describe como una prueba de 
personal, la Wonderlic Personnel Test, WPT 
(Prueba Wonderlic de Personal), es cn realidad 
una prueba grupal de capacidad mental general 
(Hunter, 1989; Wonderlic, 1983). Loque hace 
que este instrumento sea una cspccic dc insti- 
tucidn en la evaluacidn de personal cs su for- 
mato (SO reactivos de opcidn multiple), su 
brevedad (un Ifmite de tiempo de 12 minutos) y 
sus numcrosas formas paralelas (16 en la ultima 
cucnta). Los tipos dc reactivos cn la Wonderlic 
son bastante variados e incluyen vocabulario, 
rcordcnacion de oraciones, solucidn de problemas 
aritmdticos, induccidn logica e interpretacidn 
de proverbios. Los siguientes reactivos captan 
el sabor de la prueba Wonderlic: 

1. REGRESlON es lo contrario de 
a. ingestidn b. avance 

c. cierre d. apertura 

2. Dos hombres compraron un automdvil que 
costo SSO dolarcs; X pag6 SO ddlarcs m&s 
que Y. <,Cuanto pag6 X? 

a. $500 b.$300 c. $400 d. $275 

3. RENDIR HENDIR —Estas palabras ticnen 
a. significado similar b. Significado opuesto 
c. significado que no es ni igual ni opuesto 

La confiabilidad de la WPT es impresionante, 
en especial si se considera la brevedad del ins¬ 
trumento. Las confiabilidades de consistencia 
interna llcgan por lo comtfn al .90, con 
confiabilidades de formas alternas que por lo 
general superan al .90. Se encuentran disponi- 
blcs datos normativos con 126 000 adultos con 
edades de 20 a 65 afios. En cuanto a la validcz, 
si se considera que la WPT es una prueba breve 
dc la capacidad mental general, las conclusiones 
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son baslanlc positivas (Dodrill y Warner, 1988). 
Por ejemplo, Dodrill (1981) informa de una 
correlacion de .91 entre las calificaciones en la 
WPT y aquellas cn cl WAIS. Esla correlacidn 
es tan elevada como aquella encontrada entre 
cualcsquicra dos pruebas cstablccidas de la inle- 
ligcncia general. Hawkins, Faraonc, Pepple, 
Seidman y Tsuang (1990) informan de una 
correlacidn similar (r = .92) entre la WPT y el 
Cl del WA1S-R con 18 pacicntes psiquiAtricos 
crdnicamentc enfermos. No obstante, en su es- 
tudio, un individuo no pudo manejarel formato 
de la WPT, lo cual sugiere que el detcrioro 
visocspacial grave puede invalidar la prueba. 
Una rcciente innovacidn con la prueba Wonderlic 
cs la adicidn de cuatro formas de la misma 
(denominadas Scholastic Level Exam [Examen 
para nivel escolar]) que se utiliza en la sclcc- 
cidn y oricntacidn cducativa. Todavfa no se ha 
establecido de manera firme la validez de la prue- 
ba Wonderlic en ambientes educativos (Belcher, 
1992). 

Los revisores de la WPT expresan algunas 
preocupaciones acerca de las pautas interpre- 
tativas que aparcccn cn el manual de la prueba 
(Schoenfeldt, 1985). Por ejemplo, el manual su- 
gicrc que las personas que obticncn puntuacio- 
nes naturales entre 16 y 22 tienen una capacidad 
limitada para cualquicr actividad que no sea una 
tarea rutinaria. Estas puntuaciones de la WPT 
correspondcn a un Cl de 93 a 104; es decir, di- 
chas personas se encuentran dentro del rango 
normal de inteligencia por completo. Por tan- 
to, las pautas de interprctacidn parccen tanto 
arbitrarias como innecesariamentc rcstrictivas. 
El manual tambiln lista las puntuaciones de cor- 
te que se utilizan en la industria para mds de 75 
ocupaciones, lo cual hace surgir el peligro de 
que un jefe de personal, sin el entrenamiento 
necesario, interprete de manera excedida las 
puntuaciones individuates. Esto serfa especial- 
mente problemdtico cn cl caso de minorfas ra- 
ciales, dado que las difercncias de este tipo en 
la WPT son sustanciales (Schoenfeldt, 1985), 

Otra preocupacidn acerca de la prueba 
Wonderlic cs que sc penaliza injustamente a las 
personas evaluadas cuya lengua materna no es 
el inglds (Belcher, 1992). La prueba Wonderlic 


es con Ifmite de tiempo. De hccho, depende 
en gran medida de la velocidad que sc ahaden 
puntos a los individuos de 30 afios y mayores 
para compensar por la bien conocida disminu- 
ci6n en velocidad que acompana al envejeci- 
miento normal. No obstante, no se ha hecho 
ninguna modificacidn para los angloparlantes 
no nativos que podrfan tener tambidn un des- 
empeno mds lento. Una solucidn a las diversas 
cuestiones de equidad que se citan antes con- 
sistirfa en proporcionar normas para el desem- 
peno sin lfmite de tiempo en la Wonderlic. Sin 
embargo, los editores se han resistido a esta 
sugerencia. 

PRUEBA BENNETT DE COMPRENSI6N 

mecAnica 

En muchos empleos y ocupaciones, la compren- 
si6n de los principios mccdnicos es un requisito 
previo para el desempeno exitoso. Los meedni- 
cos de automotores, plomeros, ingenieros me- 
cdnicos, solicitantes de cscuclas industrialcs y 
personas en muchas otras vocaciones "manua- 
les” necesitan comprender los principios me- 
cdnicos bdsicos, a fin de tener dxito en sus 
campos. En estos casos, un instrumento util para 
la valoracidn ocupacional cs la Bennett Mecha¬ 
nical Comprehension Test. BMCT (Prueba Bennett 
de Comprensidn Mecinica). lista consiste de 
l&ninas acerca de las cuales la persona cvalua- 
da debe responder preguntas dircctas. Las si- 
tuaciones representadas enfatizan principios 
mccdnicos bdsicos que podrfan presentarse en la 
vida cotidiana. Por ejemplo, podrfa rcprcscntarse 
una serie de bandas y volantes y se podrfa pedir 
al examinando que discemiera las revoluciones 
por minuto relativas de dos volantes. La prue¬ 
ba incluyc dos formas equivalentes (S y T). 

La BMCT sc ha utilizado dc manera am- 
plia desde la segunda Guerra Mundial para la 
evaluacidn de personal militar y civil, de modo 
que existe un vasto cuerpo de datos tdcnicos y 
de validez para este instrumento. Los coeficien- 
tes de confiabilidad por mitadcs van desde .80 
hasta la parte baja del rango de .90. Se propor- 
cionan datos normativos extensos para varios 
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grupos. Con base en una cantidad enorme dc 
informacidn inicial, la validez concurrente y 
predictiva de la BMCT parece haberse estable- 
cido de mancra adecuada (Wing. 1992). Por 
cjemplo, en un estudio con 175 cmplcados, la 
correlacidn entre la BMCT y la subprueba de 
Razonamiento Mecdnico de la DAT fue un 
impresionantc .80. Una conclusion fascinante 
es que la prueba resultd ser uno dc los mejorcs 
mcdios de prediccion del dxito de los pilotos 
durante la segunda Guerra Mundial (Ghiselli, 
1966). 

A pcsar dc su cxcclcncia psicometrica, la 
BMCT neccsita rnodemizacidn. La prueba lie- 
ne una aparicncia anticuada y muchos de los 
reactivos son obsoletos. Scgun estdndarcs con- 
tcmpordncos, algunos de los reactivos de la 
BMCT son sexistas o polencialmente ofensi- 
vos para las minorfas (Wing, 1992). El proble- 
ma con los reactivos obsoletos y ofensivos es 
quc pueden scsgar sulilmcnte las calificacio- 
ncs de la prueba. La rnodemizacidn de la BMCT 
seria un proyecto scncillo que aumentarfa la 
accptabilidad de la prueba para mujeres y mi- 
norias, al mismo tiempo que preservaria su ex- 
celencia psicometrica. 

PRUEBA MINNESOTA DE TRABAJOS 
DE OFICINA 

La Minnesota Clerical Test, MCT (Prueba 
Minnesota de Trabajos de Oficina), la cual pre- 
tende medir la velocidad y precisidn perceptual 
relacionadas con el trabajo de oficina, ha per- 
manccido en esencia sin cambios en su forma- 
to desde su introduccidn en 1931, aunque las 
normas han pasado por varias revisioncs, sien* 
do la mds reciente en 1979 (Andrew, Peterson 
y Longstaff, 1979). La MCT se divide en dos 
subpruebas: Comparacidn de numeros y Com- 
paracidn de nombres. Cada subprueba consiste 
de 100 pares iddnlicosy lOOdiferentesdecom- 
binaciones de dfgitos o letras (cuadro 11-5). 
En general, los pares divergentes difieren sdlo 
cn un dfgito o lelra, dc modo que la tarea de 
comparacidn representa un desaffo. Sc requie- 
re que la persona examinada verifique sdlo los 


Cuadro 11-5. Reactivos similares 
a aquellos encontrados en la 
Prueba Minnesota de trabajos de oficina 

Comparacidn de numeros 

1. 3496482 — 3495482 

2. 17439903 — 17439903 

3. 84023971 — 84023971 

4. 910386294 — 910368294 
Comparacidn de nombres 

1. El Sol de Mdxico — El Sol de Mdxico 

2. Semillas Veldsquez — Semillas Veldzquez 

3. Juan G. Sdnchez — Juan G Sanchez 

4. Daniel Gonzdlez — Daniel Gonzdlez 


pares iddnticos, que estdn mezclados en forma 
aleatoria con pares difenentes. La puntuacidn 
depende de manera predominante de la veloci¬ 
dad, aunque se penaliza a la persona evaluada 
por los reactivos incorrectos (los errores se res- 
tan del numcro dc reactivos corrcctos). 

La confiabilidad de la MCT es accptablc, 
con coeficientes informados de estabilidad en 
el rarigo de .81 a .87 (Andrew, Peterson y 
Longstaff, 1979). El manual tambidn informa 
de gran cantidad de datos de validez, incluyen- 
do algunas conclusiones que no son del todo 
halagadoras. En estos cstudios, la MCT se 
correlaciond con medidas del dcsempefio en 
el puesto, de resultado de entrcnamicnlo y cali- 
ficaciones de pruebas relacionadas. El desem- 
pefio en ct puesto de asistentes de director, 
empleados administrativos, mccandgrafos y 
cajeros de banco se correlaciond de manera 
significativa, pero no robusta, con las califica- 
cioncs cn la MCT. fista tambidn tiene altas co- 
rrelaciones con otras pruebas de capacidad para 
trabajos de oficina. 

No obstante, aun existen dudas acerca de 
la validez y rango de aplicacidn de la MCT. 
Ryan (1985) seiiala que el manual carece de un 
aniilisis acerca de los cstudios importantes contra 
los que no lo son, relacionados con la validez. 
Ademas, los autores de la MCT no proporcionan 
informacidn dctallada acerca de los atributos 
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especfficos de los empleos, prucbas o cursos 
quc sc utilizaron como mcdidas dc critcrio cn 
los estudios dc validcz que se presentan. Por tal 
raz6n es diffcil conjeturar exactamente quc es 
lo que mide la MCT. Tanto Thomas (1985) 
como Ryan (1985) se quejan de que las nuevas 
normas de 1979 son diffcilcs de utilizar debido 
a que los autorcs dc la MCT proporcionan muy 
poca informacidn acerca dc la mancra cn quc 
se constituyeron los diversos grupos normati- 
vos. Asf, aunque el manual revisado de la MCT 
presenta nuevas normas para 10 categorfas vo- 
cacionales, es posiblc que el usuario no estd 
seguro de cu4l grupo normativo dcbc utilizar 
en su ambicnte. Debido a las notables diferen- 
cias cn dcscmpeno cntre los grupos normati- 
vos, la vagucdad de la dcfinicidn rcprescnta un 
problcma significalivo para los usuarios potcn- 
ciales dc csta prueba. 

R pruebas de personaudad 

YTEMPERAMENTO 


Varias prucbas de personalidad proporcionan 
una base util para la scleccidn dc cmpleados, 
cuando se les utiliza de manera apropiada. Al ci- 
tar prticticas pasad&s, Muchinsky (1990) advierte 
en contra del emplco imprudcntc dc las prucbas 
de personalidad para la selcccidn dc personal: 

Los invenlarlos de personalidad como ei MMPI 
[Inventario Multiliisico de la personalidad Minne¬ 
sota] se utilizaron durante muchos anos para la 
selecckSn de personal —de hecho, se usaron mat 
o de manera excesiva. Se les empleO de manera 
Indlscrimlnada para evaluar la personalidad de 
un candidalo. aun cuando no se habia estableci- 
do una rolacion entre las calilicaciones de la prue¬ 
ba y el 6xito en el puesto. Pronto, los invenlarios 
de personalidad se vieron cueslionados. 

Por supueslo, es esencial que las prucbas de 
personalidad posean un vfnculo demostrado con 
cl desempeno en el puesto, antes de que se les 
utilicc para la sclcccidn de personal. Por des- 
gracia, la literatura sobre este tema cs un tanto 
aleccionadora para la mayor parte dc las esca- 
las de personalidad. Para ilustraresta cuestidn, en 
el cuadro 11-6 se han resumido las conclusiones 


clave de Hough. Eaton, Dunnette, Kamp y McCIoy 
(1990). El cuadro presenta las correlacioncs 
medias entre diversas categorfas de mcdidas dc 
personalidad y varios criterios rclacionados con 
el puesto. Los datos sc basan cn miles de cstu- 
dios publicados cn cl periodo dc 1960 a 1984. 

El lector vcr4 que la mayor parte de las 
correlaciones son demasiado bajas como para 
tener valor prdctico. Por ejemplo, la corrclacidn 
media entre las puntuaciones de Adaptacidn (dc 
diversas esealas de personalidad) y Destreza en 
el puesto (en general calificacioncs del super¬ 
visor) es de s61o .13. Los datos para esta casilla 
sc obtuvieron de 146 estudios diferentes, dc 
modo quc los rcsultados son sumamente csta- 
bles e indican quc, cn promedio, las medidas 
de adaptacidn psicoldgica son medios muy dd- 
biles de prediccidn del desempefio laboral. No 
obstante, existen ciertas razoncs cn estos estu¬ 
dios para tener un optimismo limilado, como 
lo indica la robusta corrclacidn de -.43 entre 
Adaptacidn y Delincucncia (p. cj., dcscuido con 
los deberes laborales). Obsdrvese tambidn 
quc las mcdidas de Fiabilidad sc corrclacionan 
en promedio en -.28 con Abuso de sustancias. 
En apariencia, cs mds fdcil pronosticar cicrtos 
criterios rclacionados con el puesto que otros. 

Se sabe que algunas pruebas tienen mayor 
validez que otras para aplicacioncs cspeciTicas 
en la seleccidn dc personal. Por ejemplo, cl In¬ 
ventario Psicoldgico de California (CPI) pro- 
porciona una medida precisa del potencial para 
la gerencia (Gough, 1984, 1987). Ciertas esea¬ 
las de la CPI prcdicen razonablcmcntc bien cl 
desempefto general de los estudiantes cn aca- 
demias militates (Blake, Pottery Sliwak, 1993). 
El Inwald Personality Inventory (Inventario dc 
Personalidad Inwald) se ha validado de manera 
adecuada como prueba de investigacidn previa 
el empleo para las fuerzas policiacas (Inwald, 
1988). El Inventario Multif£sico dc Personali¬ 
dad Minnesota tambidn merece mcncidn como 
herramienta de seleccidn para las fuerzas 
policiacas (Hiatt y Hargrave. 1988). Por ulti¬ 
mo, cl Hogan Personality Inventory . HP1 (In¬ 
ventario dc Personalidad Hogan), se ha validado 
dc modo adecuado para la predicci6n del des¬ 
empeno laboral en ambientes militarcs, hospi- 
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Cuadro 11-6. Resumen de estudios de validez relacionada con el criterlo 
con pruebas de personalidad para predecir criterios laborales 


Criterios laborales 


Constmcto de 
personalidad 

Participacidn en el 
puesto 

Destreza en el 
trabajo 

Delincuencia 

Abuso de 
sustancias 

Impetuosidad* 

.04 

.04 

-.29 

.06 

Afiliacidn 

.06 

-.01 

NA 

-.03 

Adaptacion 

.13 

.13 

-.43 

-.07 

Conformidad 

.02 

-.01 

-.31 

-.04 

Fiabilidad 

.17 

.13 

-.27 

-.28 

Reflexidn' 

-.10 

.01 

-.24 

.18 

Logro 

.24 

NA 

-.35 

NA 

Masculinidad 

.10 

NA 

.02 

-.18 

Locus de control 

.25 

NA 

NA 

NA 


Noli: NA signifies una ausencia de invesUgaciOn sob*o esfa retacton enfre el medio de prediccton y el criteria 

• Rasgo de personalidad quo se caracteriza por sociaMidad. alegrfa y receptividad 

' Rasgo do personalidad que se caracteriza por andliste intelecfual y una consideracidn detenlda de las cosas 

Fuenlo: Adaptado con autorizaddn de Hough. L M. Eaton, N , DunneOo, M. Kamp, J y McCloy. R (1990) Critorionrelated validities of 

personallly constructs and the effect ol response distortion on those vaNdllies (Monografia) Journal of Applied Psychology, 7S, 581-595 


lalarios y corporativos. El HP1 sc bas6 cn la 
tcorfa dc los Cinco Grandcs factores de la per¬ 
sonalidad (Tema 13A, Teorfas y medicidn de la 
personalidad). Este instrumento se sometid a 
una validacidn cruzada relacionada con el cri- 
terio que dio por resultado una validez tan 
alta como .60 para algunas escalas (Hogan, 
1986; Hogan y Hogan, 1986). En el Tema 
14A, Inventarios de autoinforme, se analizan 
aplicacioncs adicionales de las pruebas de per¬ 
sonalidad en relacidn con el trabajo. Borman et 
al. (1997) proporcionan un buen resumen de 
los estudios recientes sobre este tema. 


■ PRUEBAS DE INTEGRIDAD 
DE LAPIZ Y RAPEL 


Varios editores de pruebas han introducido 
instrumentos disenados para detectar a los in- 
divtduos propensos al robo y a otros candidatos 
indeseablcs como son las personas poco dignas 
dc confianza o que se ausentan con frecuencia 


del trabajo (Hogan y Hogan, 1989; O’Bannon, 
Goldingery Appleby, 1989; Ones y Viswesvaran, 
1998; Ones, Viswesvaran y Schmidt, 1993; 
Sackett, Burris y Callahan, 1989). Estas prue¬ 
bas se presentan en dos tipos claramcnte dife- 
renciados: pruebas explfcitas dc integridad y 
medidas basadas cn la personalidad. Se anali- 
zard cada tipo por separado, concentrando la 
atencidn en aqucllas cuestiones que surgen dc 
estas pruebas mds que en dctallar los mdritos o 
demdritos de los instrumentos individuates. El 
cuadro 11-7 lista 20 de los instrumentos de 
empleo mds comun. 

Un problema con las pruebas de integridad 
es que su naturalcza de instrumentos exclusivos 
dificulta examinarlas de la misma manera que 
a los tradicionales. En la mayor parte dc los 
casos, las claves de calificacidn s61o cstdn dis- 
poniblcs para los psicdlogos de la institucidn 
que las uliliza, lo cual hace diffcil la investiga- 
ci6n independientc. No obstante, en la actualidad 
existe un cuerpo considerable de investigacidn 
sobre las pruebas de integridad, como se anali- 
za en la siguiente seccidn sobre validez. 
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Cuadro 11-7. Pruebas de integridad 
de uso comun 

Pruebas explicitas de integridad 

Acculrac Evaluation Systom (Sistema de eva- 
luacion Acculrac) 

Applicant Review (Revisi6n del solicitante) 
Compuscan 

Employee Attitude Inventory (Inventario de ac- 
litudes del empleado) 

Employee Reliability Inventory (Inventario de 
confiabilidad del empleado) 

Integrity Interview (Entrevista de Integridad) 
Orion Survey (Estudio Orion) 

PEOPLE Survey (Estudio PEOPLE) 

Personnel Selection /nventory(lnventario de se- 
leccibn de personal) 

Phase II Profile (Perfil fase II) 

Reid Report and Reid Survey (Inlorme Reid y 
Estudio Reid) 

Rely 

Stanton Survey (Estudio Stanton) 

True Test (Prueba de verdades) 

Pruebas de integridad basadas en la personalldad 

Employment Productivity Index (Indice de pro- 
ductividad del empleo) 

Hogan Personnel Selection Series (Serie Hogan 
de seleccidn de personal) 

Inwald Personality Inventory (Inventario Inwald 
de personalldad) 

Personnel Decisions Inc., Employment Inven¬ 
tory (Inventario de empleo de Personnel 
Decisions Inc.) 

Personnel Outlook Inventory (Inventario de ac- 
titud del personal) 

Personnel Reaction Blank (Formulario de reac- 
ci6n del personal) 


Nota: Los edttores y autores de estas pruebas pueOen encootrar • 
se en O'Bannon, R. M , GoWInger. L. A y Appleby, G S. (1989) 
Honesty and integrity testing Atlanta, GA Applied Intormatlon 
Resources. 

PRUEBAS OE INTEGRIDAD 

Las pruebas de integridad constan. por lo co¬ 
mun. de dos secciones. La primcra es una scc- 
cidn quc trata sobrc las actitudes hacia el robo 
y otras formas de deshonestidad, como las 
creencias acerca del alcancc de los robos por 
parte de cmplcados, grade de condena hacia el 


robo. aprobacidn de las racionalizaciones co- 
munes sobre cl mismo y facilidad pcrcibida de 
dste. La segunda es una seccidn quc trata sobrc 
las admisiones explicitas de robo y de otras ac- 
tividades ilcgales, como artfculos robados en 
cl ultimo afio, prdctica de juegos de apucstas y 
uso de sustancias prohibidas. Las pruebas de 
este tipo que se han investigado mds son el 
Personnel Selection Inventory (Inventario de 
scleccidn de personal), el Reid Report (Informe 
Reid) y la Stanton Survey (Encucsta Stanton). 
El lector interesado puedc encontrar las direccio- 
ncs de los editores de cstos y otros instrumentos 
relacionados en O’Bannon et al. (1989.) 

En apariencia, las pruebas de integridad 
pueden falsearse de manera mds send) la que 
aqudlas basadas en la personalidad y, por tanto, 
podrfan tener menor valor en la investigacidn 
de los solicitantes deshonestos. Por ejemplo, 
Ryan y Sackctt (1987) crcaron una prueba ge- 
ndrica de integridad, modclada a partir de los 
instrumentos existentes. La prueba content's 52 
reactivos sobre actitud y 11 sobre admisidn. En 
comparacidn con un grupo de contrastacidn al 
que se le pidid que contestara con sinceridad y 
otro al que se le pidid que respondiera como 
solicitantes de empleo, los participantes a los 
que se les solicitd que “falsearan las rcspucstas 
para dar buena impresidn” produjeron puntua- 
cioncs sustancialmente superiores (es deeir, 
mejores actitudes y menos admisiones de robo). 

PRUEBAS DE INTEGRIDAD BASADAS 
EN LA PERSONALIDAD 

Por lo comun, las pruebas de integridad basa¬ 
das en la personalidad no contienen rcfcrencias 
obvias al robo o a otras formas de conducta in- 
deseable de parte del empleado. Estas medidas 
son m4s sutiles en su enfoque y, por tanto, son 
menos ofensivas para la mayorfa de los candi- 
datos a un pucsto. De hecho, algunas pruebas 
de integridad no son en realidad m£s que par¬ 
tes recicladas de pruebas existentes de la per¬ 
sonalidad como el Inventario Psicoldgico de 
California (CPI). Por ejemplo, el Personnel 
Reaction Blank (Formulario de Reacciones del 






Personal; Gough, 1971) se basa en aqucllas 
partes del CPI que tratan sobre sociabilidad, 
fiabilidad, escrupulosidad, valores intemos, 
continencia y aceptacidn de costumbres. En 
general, las medidas de Idpiz y papel acerca de 
la escrupulosidad muestran fuertes relaciones 
con la integridad relacionada con cl trabajo 
(Collins y Schmidt. 1993). 

Una estrategia comun de desarrollo de 
prueba para las medidas de integridad basadas 
en la personalidad es la codificacidn empfrica 
contra un critcrio de robo. El problema con este 
enfoque es el critcrio: es raro que sc hagan 
aprensiones por robo y las admisiones de dste 
pueden ser precisas o no. La tasa base de robo 
de emplcados es casi imposible de cstablecer 
con precisidn. Porcjemplo, las tasas de autoin- 
forme de robo van de 28 a 62% en diferentes 
estudios (Camara y Schneider, 1994). Asf, la 
clasificacidn de criterio de algunos individuos 
investigados puede no ser vdlida. Un segundo 
enfoque consiste en medir constructs amplios 
como la desviacidn general del empleado que 
se indica por la hostilidad hacia la autoridad, 
busqueda de cmociones, imesponsabilidad e in- 
sensibilidad social. Los instrumentos que emplcan 
esta estrategia demuestran una capacidad mo- 
derada para predecir criterios globales como las 
calificaciones del supervisor acerca de la efica- 
cia (Ones y cols., 1993; Sacked y cols., 1989). 

Un problema grave con la mayor parte de 
las pruebas de integridad es la tasa elevada 
de error, que de manera comun sc cncuentra en 
el rango de 30 a 60%. Debido a que, por lo 
general, las pruebas de integridad son la ultima 
barrera —se utilizan s61o con la pequena frac- 
cion de solicitantes que tienen la capacidad ne- 
cesaria y la expericncia pertinente— las 
organizaciones que emplcan estas pruebas de- 
ben estar en posicidn de descartar a la mayorfa 
de los solicitantes. Por supuesto, la elevada tasa 
de error es consecuencia, en parte, de las es- 
Irictas puntuaciones de corte, lo cual produce 
el rechazo de los empleados potencialmente va- 
liosos (falsos positivos) junto con los verdadc- 
ros ladrones y truhanes (verdaderos positivos). 
De hecho, dsla es una cuestidn de validez, como 
se analiza en la siguiente seccion. 
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VAUDEZ DE LAS PRUEBAS 
DE INTEGRIDAD 

Los editores de las pruebas de integridad han 
respondido a los psicdlogos escdplicos y al pu¬ 
blico desconfiado con una andanada de estudios 
de validez relacionada con el criterio. Ones y 
colaboradores (1993) le solicitaron datos sobre 
pruebas de integridad a las editoriaies, autores 
y colegas. Estas fuentes rcsultaron ser suma- 
mente coopcrativas: los autores rcunieron 665 
coeficientes de validez basados en 25 pruebas 
de integridad aplicadas a mis de medio milldn de 
empleados. Con intrincados procedimientos 
de metaan^lisis, Ones y colaboradores (1993) 
calcularon un coeficiente promedio de validez 
de .41 cuando las pruebas de integridad sc uti- 
lizaron para predecir las calificaciones del su¬ 
pervisor acerca del desempeno laboral. Es 
interesante scnalar que las pruebas de integri¬ 
dad predijeron las conductas de indisciplina en 
general (robo, actividades ilegales, ausenlismo, 
retardos, abuso de sustancias prohibidas, des- 
pidos debidos a robo y violcncia en el trabajo) 
mejor de lo que lo hicieron con el robo de parte de 
empleados por s( solo. Los autores concluyeron 
con un tenue respaldo para estos instrumentos: 

Cuando comenzamos con nuestra investigation 
sobre las pruebas de integridad, nos mostrSba- 
mos escbpticos, al Igual que muchos otros pst- 
cblogos industriales, acerca del uso de las 
pruebas de integridad en la industria. Ahora, con 
base en los anAlisis de una enorme base de da- 
los consistente de mds de 600 coeficientes de 
validez, concluimos que las pruebas de integri¬ 
dad tienen evldencia sustancial de validez 
generalizable. 

Una serie de ingeniosos estudios de Cunningham, 
Wong y Barbee (1994) hacen eco de esta con- 
clusidn. Entre otros datos de apoyo, estos in- 
vestigadores descubrieron que los resultados de 
pruebas de integridad se correlacionaban con 
la rcintcgracidn de excedentes en el pago de 
salarios —incluso cuando se habfa instruido a 
los individuos para que dieran una impresi6n 
positiva en la prueba de integridad. 

Otros revisorcs se muestran mils cautos en 
sus conclusiones. Al comcntar las recientes re- 
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sefias de la American Psychological Association 
y de la Office of Technology Assessment, 
Camara y Schneider (1994) llegaron a la detcr- 
minacidn de que las pruebas de inlegridad no 
satisfacen las expcctativas de los expertos en 
evaluacidn, pero que es probable que scan me- 
jorcs que los mdtodos crrdticos, sin cstandariza- 
ci6n, que utilizan muchos empleadores para 
elegir a los solicitantes. 

Sigucn existiendo varias preocupacioncs 
acerca de las pruebas de integridad. Las edito- 
riales pueden poner a la venta sus instruments 
para los usuarios no calificados, lo cual viola los 
estdndares dticos de la American Psychological 
Association. Un segundo problema surge del 
dcsconocimicnto de la tasa base de robo y de 
otras conductas indescables, lo cual dificulta la 
identificacidn de puntuaciones dptimas de cor- 
te para las pruebas de integridad. Si dstas son 
muy estrictas, sc dcscalificard de manera injus- 
ta a los candidatos honestos. Por el contrario, 
una puntuacidn muy indulgente de corte hacc 
que la prueba sea inutil. Una ultima prcocupa- 
cidn es que los factores de la situacidn pueden 
moderar la validcz de estos instruments. Por 
ejemplo, la manera cn que se presenta una prue¬ 
ba a las personas examinadas puede afcctar 
poderosamente sus rcspucstas y, por tanto, ses- 
gar la validcz del instrument. 

Cada vcz es mis frecucntc que las legisla¬ 
tures y tribunates decidan el dcstino de las prue¬ 
bas de seleccidn a un empleo. Para los autores 
de pruebas y para el publico, el riesgo es elevado: 
las compaiil'as en EUA aplican un estimado de 
5 mi Hones de pruebas de integridad cada aho. 
A partir de 1994, Massachusetts fue cl unico 
cstado cn prohibir las pruebas de integridad, 
pero cuando mcnos cn otros seis la lcgislacidn 
cstd pendientc (Camara y Schneider, 1994). Es 
muy probable que la utilizacidn de pruebas de 
integridad se restrinja cada vez mas en los ahos 
por venir. 

El debate sobre las pruebas de integridad 
enfrenta los intereses legftimos de las compa- 
nfas contra los dcrechos individuales de los tra- 
bajadores. Con toda seguridad, las empresas 
ticnen derecho a no contratar ladrones, droga- 
dictos y agitadorcs. Pero en la buxqueda de csta 


meta, £cu& es cl cost ultimo para la socicdad 
de que se cuestione a millones de solicitan¬ 
tes de empleo acerca de sus conductas pasadas 
en cuanto a drogas, alcohol, conducta criminal 
y otras cuestiones sumamente personates? 
Hanson (1991) ha preguntado de manera retd- 
rica si se bencficia a la socicdad con el equili- 
brio actual de podcres —cn cl que las empresas 
pueden obtener informacidn personal acerca de 
quidn es supuestamenle valioso y de quidn no 
lo es. Parece casi inevitable que el Congreso 
de EUA entre en el debate. En 1988, cl Presi- 
dentc Reagan firmd cl Employee Polygraph 
Protection Act (Decrcto de proteccidn de em- 
plcados contra el polfgrafo) que elimind cfecti- 
vamente las pruebas de polfgrafo en la industria 
(veasc Tcma 10B, Aplicaciones forenses de la 
evaluacidn). Quizas en los siguientes ahos se 
vea una reduccidn abrupta de las pruebas de 
integridad debido a un Decreto de proteccidn 
de empleados contra las pruebas de integridad. 


8 ESTRUCTURA Y MEDICION DE 
HABIUDADES PSICOMOTRICES 


Guion (1991) ha scnalado la curiosa paradoja 
de que las capacidades sensoriales, ffsicas y de 
destreza sean esenciales para el dxito en mu- 
chas situaciones laborales y que, no obstante, 
dstas casi nunca sc cvaluen como parte de la 
investigacidn o seleccidn de empleados. La fal- 
ta de dichas pruebas no s6lo es desaforlunada 
desde los puntos de vista de la eficacia y cqui- 
dad en la seleccidn de empleados, sino que tam- 
bidn hace surgir preocupaciones acerca de 
demandas legates, como se analizard mds ade- 
lante. En esta seccidn se revisan de manera bre¬ 
ve los instruments y cuestiones relacionadas 
con la evaluacidn de las habilidades psicomotri- 
ces. Pueden encontrarsc perspectivas adiciona- 
les sobre estc tcma en Hogan y Quigley (1994) y 
en Blakley, Quinones, Crawford y Jago (1994). 

Es importante una comprensidn adecuada 
de los requisitos sensoriomotores de trabajos 
especiTicos por varias razones. Primero, los 
solicitantes con discapacidad ffsica tienen una 
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base legftima para demandar legalmente si se 
les nicga empleo debido a limitaciones psico- 
moirices que no tienen relacibn con el desem- 
pciio en el pucsto. Por tanto, los emplcadorcs 
esian cn una posicibn en la que necesilan docu- 
mcntar, por medio de un analisis de puestos, 
estudios de validez o ambos, que se requiercn 
nivcles mfnimos de habilidad psicomotriz para 
cl descmpeno eficientc en el trabajo. En otro 
sentido, los cmpleados pueden demandar a la 
compama si se lesionan o dcsarrollan problc- 
mas de salud cn un pucsto para cl cual no posccn 
un nivcl ncccsario dc habilidad ffsica. Como 
scnala Guion (1991), las cuestiones sobre ha¬ 
bilidad psicomotriz son demasiado importan- 
tes como para dejarlas al examen medico 
tradicional. 

TAXONOMIA DE LAS HABIUDADES 
PSICOMOTRICES 

Fleishman y sus colaboradones han analizado 
intensamente durante varios ados la medicidn 
de las habilidades psicomotrices (Fleishman, 
1975; Fleishman y Quaintance, 1984). Con base 
en numcrosos estudios analftico-factorialcs, cs- 
tos invcstigadorcs han idcntificado ccrca de 20 
factores cspecfficos dc habilidad cn cl dominio 
psicomotriz (Fleishman, 1975). Once de estos 
factores se denominan capacidadcs percepto- 
motriccs, mientras nueve se llaman capacida¬ 
dcs de destreza ffsica (cuadro 11-8). Fleishman 
ha dcsarrollado esealas dc calificacibn para 
ayudar a los empleadores a determinar las ca- 
pacidades ffsicas requeridas para puestos es- 
pecfficos —cl lector interesado puede consultar 
los detalles en Fleishman y Mumford (1988). 
En este caso se restringe la cobertura a pmebas 
m&s tradicionales que pueden utilizarsc para la 
evaluacibn de las habilidades psicomotrices de 
cmpleados polenciales. 

En algunas ocupaciones —en particular cn 
oficios manualcs— las pnicbas dc habilidades 
psicomotrices pueden utilizarse para seleccidn 
o eolocacion. Sin embargo, los usuarios debc- 
rfan demostrar la relevancia dc los criterios dc 
seleccidn para cl desempeno del puesto en sf 


Cuadro 11-8. Taxonomfa de habilidades 
psicomotrices 


Capacidades 

porceptomotrices 

Capacidades de 
destreza ffsica 

Precisidn del control 

Flexlbllldad de 
extensibn 

Coordinacibn de 

Flexibilidad dinamica 

multiples miembros 

Orientacion de 

Fortaleza estbtica 

respuesta 

Tiempo de reaccidn 

Fortaleza dinamica 

Velocidad de 

Fortaleza explosiva 

movimiento de brazo 

Control de frecuencia 

Fortaleza del tronco 

(manejo de tiempo) 

Destreza manual 

Coordinacibn corporal 
gruesa 

Oestreza de dedos 

Equilibrio 

Firmeza brazo-maoo 

Vigor 

Velocidad mufieca-dedos 

Tino 


Fuenta: Retshman, E. A. (1975). Toward a taxonomy ol human 
performance American Psychologist, 30.1127-1149 


(Hogan, 1991). A conti nuacibn se revisa una 
mucstra de dichas pruebas. 

ESTUDIO DE AP7TTUD DEL EMPLEADO 

Dos de las 10 subpruebas del Employee Aptitude 
Survey, EAS (Estudio de Aplitud del Empleado) 
pueden utilizarse para evaluar habilidades per- 
ceptomotoras (Ruch y Ruch, 1980). El EAS es, 
principalmente, una baterfa cognitiva que se 
utiliza en la seleccidn dc personal dentro de orga- 
nizacioncs. No obstante, la Prucba 3 —Busquc- 
da Motora— y la Prueba 9 —Velocidad y Pre¬ 
cision Manual—captan varias de las habilidades 
perceptomotoras propuestas por Fleishman. La 
subprueba de Busqucda Motora consta de 30 
lfncas entrelazadas con otras. La tarca consiste 
en trazar con rapidez cada Ifnca desde el princi- 
pio hasta el final, como en el diagrams dc un cir- 
cuito elbctrico. Cada lfnea tormina en una dc 
cinco letras —las opciones dc respuesta. Se uli- 
lizan tanto las respucstas correctas (C) como 
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las incorrcctas (A) para calcular la puntuacidn 
(P) con la fdrmula P - C - 1/4. La subprueba 
tiene un Ifmite de ticmpo de cinco minutos y 
parecerfa captar capacidades perceptomotoras 
importantcs como precisidn del control, des- 
treza manual y firmeza de brazo-mano (cuadro 
11-8). Esta subprueba se recomienda para se- 
leccionar puestos como dibujanlc, ingeniero de 
diseflo y tdcnico. La subprueba de Velocidad y 
Prccisidn Manual consistc cn colocar un punto 
hecho con Idpiz en tantas letras O como sea 
posiblc cn un Ifmite de tiempo de cinco minu¬ 
tos. Los puntos marcados deben estar dentro 
del cfrculo y los errores se sancionan. La 
fdrmula para la puntuacidn corrcgida es P = 
C - (5 x A). Esta subprueba mide tino y otras 
capacidades perccptomotriccs y se recomien¬ 
da para la seleccidn a puestos como el de traba- 
jador administrative, operario de maquinaria y 
trabajos que rcquicrcn precisidn o tareas re- 
pelitivas. 

El Informe Tdcnico (Ruch y Ruch, 1980) 
presenta buenas confiabilidades test-retest para 
las subpruebas (principalmentc en el rango de 
.80) y proporciona datos normativos para 57 
cmplcos o catcgorfas de empleo espccfficos. 
Tambidn se proporcionan las calificaciones rc- 
sumidas de mis de I 000 empleados varoncs de 
una cotnpanfa de manufacturas. La brevedad 
de las subpruebas de Busqueda Motora y Velo¬ 
cidad y Precision Manual (Ifmite de tiempo de 
cinco minutos cada una) las hace opciones su- 
mamente atraclivas cn la seleccidn inicial para 
puestos tdcnicos y administrativos que requic- 
ren precisidn cn tareas rdpidas. Para una revi- 
sidn reciente del EAS vdasc Fitzpatrick (1984). 

PRUEBA MINNESOTA DE TASA 
DE MANIPULACI6N 

La Minnesota Rate of Manipulation Test (Prue- 
ba Minnesota de Tasa de Manipulacidn) es un 
pilar venerable y respetado para la evaluacidn 
de la destreza dedos-mano-brazo. Esta prueba 
se ha utilizado desde el decenio de 1940 para 
la seleccidn de empleados en una amplia varie- 
dad de ambientes industriales. La prueba cons- 


ta de un tablero con 60 orificios con cilindros 
hechos a la medida, que son rojos de un lado y 
amarillos del otro. Las cinco subpruebas inclu- 
yen: Colocaci6n, Vuelta, Desplazamiento, Vuelta 
y colocacidn con una mano, y Vuelta y coloca- 
ci6n con ambas manos. Para cada subprueba 
se instruye a los examinandos a que mserten, 
volteen o muevan los cubos tubularcs de ma- 
ncras espccfficas con la mayor velocidad posi- 
ble. Se proporcionan normas de refcrencia para 
una muestra de 11 000 adultos jdvcncs y 3 000 
adultos mayorcs. Esta prueba parecerfa medir 
las variables de Fleishman de velocidad de 
movimiento del brazo, destreza manual y des¬ 
treza de dedos. 


TEST NO VERBAL DE LA UNIVERSIDAD 
DE PURDUE 

Otra prueba de habilidades psicomotrices que 
se utiliza ampliamente en la investigaci6n pre¬ 
via al empleo es el Test no verbal de la Univer- 
sidad de Purdue. Esta prueba se disefid cn la 
Universidad de Purdue en 1948 como auxiliar 
en la seleccidn de empleados para di versos ti- 
pos de (rabajo manual. La prueba mide destre¬ 
za para dos tipos de actividad: movimientos 
gruesos de las manos, dedos y brazos; y destre¬ 
za en la punta de los dedos necesaria para ta¬ 
reas de ensamblado. Esta prueba parecerfa 
evaluar una mezcla compleja de las habilida- 
des psicomotrices que identified Fleishman. En 
el cuadro 11-9 se describen varies pruebas adi- 
cionales de capacidades perceptomotrices. 

Desde un punto de vista prictico, las pruc- 
bas psicomotrices como dsta pueden ser muy 
utiles para establecer los niveles mfnimos de 
desempefio con propdsitos de invcstigacidn pre¬ 
via al empleo. No obstante, su utilidad en la 
seleccidn y colocacidn de personal es limitada. 
Uno de los principals problemas es que, por 
lo comun, las pruebas psicomotrices muestran 
sustanciales efectos de prdctica. Lo que es mas, 
dstos son sumamente variables de un individuo 
a otro, lo que significa que, por lo comun. la 
confiabilidad de estas pruebas es sdlo modesta 
—las confiabilidades test-retest pocas veces 
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Cuadro 11-9. Pruebas de habilidades 
perceptomotrices 


Roeder Manipulative Aptitude Test (Prueba 
Roeder de aptitud de manipulacldn): clasifica- 
cion y ensamblaje de tuercas, lornlllos y arandelas. 

Pennsylvania Bi-Manual Worksample (Muestra 
de trabajo bimanual de Pennsylvania): ensam¬ 
blaje de tuercas y tornillos. 

O’Connor Finger Dexterity Test (Prueba 
O’Connor de Destreza de dedos): colocacidn 
manual de pernos en orilicios. como en una Knea 
de ensamblado. 

O'Connor Tweezer Dexterity Test (Prueba 
O'Connor de destreza con pinzas): utilizacion 
de pinzas para colocar pernos individuales en ori- 
ficios con didmelro de 1/16 de pulgada. 

Grooved Pegboard (Tablero ranurado para 
clavijas): rotacion y colocacion de clavijas en ra- 
nuras que tienen orientaciones aleatorias. 

Stromberg Dexterity Test (Prueba Stromberg 
de destreza): colocacidn de 54 discos circulares 
de colores (rojo, amarillo, azul) en una secuencia 
predetermlnada. 


Nolo: Estas pruebas pueden oblenerse en la Lafayette Instrument 
Company, on l/e otras fuentes 

superan a .80 y a menudo son mucho mds ba- 
jas, en los ranges dc .50 y .60. 

■ MUESTRA DE TRABAJO Y 
EJERCICIOS SITUACIONALES 

Una muestra de trabajo es una rdplica en mi- 
niatura del trabajo que han solicitado las per¬ 
sonas evaluadas. Muchinsky (1990) senala que 
la meta del psicdlogo I/O al disenar una mues¬ 
tra dc trabajo consiste en "tomar el contenido 
del pucsto dc la persona, reducirlo a un periodo 
manejable y permitir que los solicitantcs 
demucslrcn su capacidad para realizarlo”. 
Guion (1991) ha enfatizado que no cs necesa- 
rio que las muestras de trabajo incluyan (odos 
y cada uno de los aspectos dc un puesto, pero 
deberian enfocarse en los elementos mis diff- 
cilcs que discriminen de manera eficaz a los 
candidatos debiles de los fuertes. Por ejemplo. 


un puesto de oficinista-mecandgrafa puede in- 
cluir tambidn el hacer cafe y mandados para cl 
jcfc. Sin embargo, dstas son tarcas triviales que 
demandan tan poca habilidad que sena inutil 
incluirlas en una muestra de trabajo. &>ta dc- 
berfaexaminardominios importantes del pues- 
lo, no el universo complcto del puesto. 

Campion (1972) disend una ingeniosa 
muestra para mecanicos que ilustra el concepto 
anterior. Con las tdcnicas de andlisis de puestos 
que se analizan al principio de cste tema. Campion 
determjn6 que los aspectos csencialcs para scr 
un buen mecdnico se definfan por el empleo 
cxitoso dc herramientas, precision del trabajo 
y capacidad mecdnica general. Con ayuda de 
niecdnicos expertos, disend una muestra de tra¬ 
bajo que incorporaba estos aspectos del pucsto 
a traves de tarcas tfpicas como instalar poleas y 
reparar una caja de velocidades. Se asignaron 
puntos a las conductas componentcs para cada 
tarea. Los reactivos de ejemplo y sus pondera- 
ciones correspondicntes fueron los siguientes: 

Instalacion de Calificacion pondcrada 
poleas y bandas 

1. Antes de instalar, veriftca la chaveta contra: 


_ Eje 2 

_ Polea 2 

_ Ninguno 0 

Dcsarmado y reparat ion de caja dc engranes 

10. Rctira el cojinete viejo con: 

_ prensa y punzdn 3 

_ extractor de cojinetes 2 

_ extractor de engranes 1 

_ olro 0 


Insertar un bujc en la catalina y limar para 
ajustar a un eje 

4. Veriftca el didmetro intemo del buje contra 


el didmetro del eje: 

_ visualmente 1 

_ calibrador de agujeros 

y micrometros 3 

_ calibrador Vernier 2 

_ escala 1 

_ no veriftca 0 
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Campion encontrd que el desempcfio de 34 va- 
rones, mecdnicos dc mantenimicnto, en la me- 
dida de muestra de trabajo se relacionaba de 
manera significativa y posiliva con las valora- 
ciones del supervisor acerca de su dcscmpcfto 
en el puesto, con coeficienles de validez de .42 
a .66. 

Un cjcrcido situncionnl es aproximadamcn- 
le el equivalcnte para cmplcados dc una mues¬ 
tra de trabajo. Estos ejercicios se utilizan en gran 
medida para seleccionar a personas para puestos 
gerenciales y profesionales. La principal diferen- 
cia enlre un ejcrcicio situacional y una muestra 
dc trabajo es quc cl primero rcfleja sdlo parte del 
puesto, mienlras que el tiltimo es un microcos¬ 
mos del trabajo completo (Muchinsky, 1990). 
En un ejcrcicio situacional se pide al posible 
empleado que se desempefte bajo circunstan- 
cias que son sumamcnte similares al ambicntc 
laboral anticipado. Se pucden obtencr entonces 
medidas de logro como una base para eslimar 
la probable productividad u otros aspcctos dc 
cficacia en el puesto. Los ejercicios situacionalcs 
con la mayor validez mucstran una scmejanza 
estrccha con el critcrio; es decir, los mejores 
ejercicios son extremadamentc realistas (Asher 
y Sciarrino, 1974; Muchinsky, 1990). 

Las muestras de trabajo y los ejercicios 
situacionales se basan en la sabidurfa conven- 
cional dc que cl mejor medio de prcdiccidn del 
desempefio futuro en un drea cspecffica es cl 
rendimiento pasado en esa misma area. Por lo 
comun, un cjercicio situacional requiere que el 
candidato se dcsempehe en un ambicntc que 
sea muy similar al ambiente laboral destinado. 
Asf, las medidas de desempeno resultantes se 
asemejan a aquello que compone al trabajo 
eventual en sf. 

A lo largo de los ahos se han desarrollado 
cientos de muestras de trabajo y ejercicios 
situacionales. Por cjcmplo, en una resefta ante¬ 
rior, Asher y Sciarrino (1974) identificaron 60 
procedimientos, incluycndo las siguientes: 

• Prueba de mecanograffa para personal de ofi- 
cina. 

• Prueba de ensamblaje medlnico para mecd- 
nicos de telares. 


• Prueba de lectura de mapas para controlado- 
res aercos. 

• Prueba de destreza con herramientas para ma- 
quinistas y riveteadorcs. 

• Prueba de organizacidn de encabezados, 
diagramacion e historias para editores dc 
revista. 

• Prueba oral de indagacidn para consultoics 
en comunicacidn. 

• Prueba de role-playing para personal de ven- 
tas telefdnicas. 

• Rcdaccidn dc cartas dc ncgocios para ge- 
rentes. 

Un ejercicio situacional muy eficaz que se ana- 
lizard aquf es la tdcnica de bandeja dc entrada, 
un procedimicnlo que Simula cl ambiente dc 
trabajo dc un administrador. 

PRUEBA DE BANDEJA DE ENTRADA 

El artfculo tfpico sobre la Prueba de Bandeja 
de Entrada es la monograffa de Fredericksen 
(1962). Para este amplio estudio, Frederiksen 
disend la Bureau of Business In-Basket Test 
(Prueba de Bandeja dc Enuadadcl Dcpaitamcnto 
Comercial), que consiste de cargas, memoran- 
dos, registros dc llamadas (clefdnicas y otros 
documentos que se acumulan en la bandeja dc 
entrada dc un ejecutivo recien contratado de un 
dcparlamcnto comercial. En esta prueba no sc 
pide al candidato que represente un papel, sino 
que sea dl mismo.* £ste no debe decir lo que 
harfa, debe hacerlo. 

Las cartas, memorandos, llamadas telcfd- 
nicas y entrevistas que se rcalicen en este am¬ 
biente laboral simulado constituyen el regislro 
de conducta que se califica tanto en referenda 
al contenido como al estilo dc las respucstas. 
El estilo dc rcspucsta se refiere a c6mo se lle- 
v6 a cabo la tarea —con cortesfa, por teldfono, 
mediantc la participacidn de un superior, dele- 


* No intentamos promover aquf un sexismo sutil, pero 
dc hccho Frederiksen (1962) evalud a una muestra de 
estudiantes, admiuisti adores, cjecuti vos y ofdales del 
cjdrcito quc dc manera predominante (si no es quc 
cxclusiva) cran varoncs. 
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gando a un subordinado y dcmas. El conteni- 
do sc rcficrc a lo quc sc hizo, incluyendo pla¬ 
nes, establecimiento de fechas Ifmite, busqucda 
de information; tambien se calculan varios in¬ 
dices cuantitativos, incluyendo el numcro de 
reactivos intentados y el total de palabras es- 
critas. Para algunos criterios de calificacidn, 
como capacidad de inventiva —el numero de 
Ifncas de accidn quc parccieron buenas ideas— 
se requiere del juicio experto. 

Frederiksen (1962) aplied su prueba de 
bandeja de entrada a 33S individuos, incluyen¬ 
do estudiantes, administradores, ejecutivos y 
oficiales del ejdrcito. La calificacidn de la prue¬ 
ba fuc un proccdimicnto complcjo que requino 
del desarrollo de un manual con 163 pdginas. 
La confiabilidad pares-nones de los reactivos 
individuals vari6 considerablemente, pero sur- 
gicron suficicntcs reactivos con una confiabi¬ 
lidad modesta (r de .70 y superiorcs) como para 
quc Frederiksen (1962) pudiera realizar varios 
andlisis factoriales y tambidn hacer compara- 
ciones grupales significativas. 

Cuando las calificacioncs de los reactivos 
individuates se corrclacionaron entre sf y des¬ 
puds se sometieron a andlisis factorial, se pudo 
describir la conducts de los administradores 
potcncialcs en tdrminos de ocho factores pri- 
marios. Cuando las calificaciones de cstos fac¬ 
tores primarios cn si sc sometieron a analisis 
factorial, surgieron tres factores de segundo 
orden. £stos dcscriben la conducta administra- 
tiva en los tdrminos mds generates posiblcs. La 
primera dimension es Preparacidn para la ac- 
ci6n, que se caracteriza por diferir las decisio- 
nes finales hasta que se obtenga information y 
conscjo. La segunda es sencillamente Cantidad 
de trabajo, que represents las grandcs diferen- 
cias individuals en cl mcro trabajo llevado a 
cabo. La tercera se denomina Busqucda de 
oricntacidn, dondc las personas con altas pun- 
tuaciones parecen ser ansiosas c indecisas. Es- 
tas dimensiones se adecuan bien a la teorfa 
existente acerca del desempefio del administra- 
dor y, por tanto, sustentan la validez de la (area 
de Frederiksen. 

Cuando dstc compard los grupos de indi¬ 
viduos cn las dimensiones calificables de la 
prueba de bandeja de entrada, surgieron varios 


atributos sobresalientes. Por ejemplo, los estu¬ 
diantes de pregrado dcstacaron la productivi- 
dad verbal, los administradores del gobierno 
carecian de preocupacion por personas exter- 
nas, los ejecutivos comerciales cran muy Corte¬ 
ses, los oficiales del ejdrcito exhibieron fuertc 
control sobre subordinados y los directorcs de 
escuela carecfan de control firme. Estas dife- 
rencias grupales hablan cn gran medida de la 
validez de constructo de la prueba de bandeja 
de entrada, ya quc los resultados son consis- 
tentes con las expectativas tcdricas acerca de 
cstos grupos de participanics. 

Los primeros estudios sustentan la validez 
predictiva de las pruebas de bandeja de entrada. 
Por ejemplo, Brass y Oldham (1976) demos- 
traron que cl desempefio en una prueba de ban¬ 
deja de entrada ticne correspondence con cl 
desempcho en el puesto de los capataces, si sc 
utilizan categories apropiadas de calificacidn de 
la bandeja de entrada. En tdrminos especiTicos, con 
base en esta prueba, los capataces que recom- 
pensan pcrsonalmcnte a los cmplcados por el 
trabajo bien hecho, que castigan por el trabajo 
deficiente, que establecen objetivos especfficos 
de desempefio y quc enriquccen los trabajos de 
sus subordinados, tambidn reciben una califi- 
cacidn alia como administradores eficaces de 
parte de sus superiorcs. El podcr de prediccidn 
de estas dimensiones de bandeja de entrada fuc 
significativo, con coeficientes de correlacidn 
multiple de .34 entre los medios de prediccidn y 
el criterio. En la actualidad pueden adquirirse 
pruebas estandarizadas de bandeja de entrada 
para utilizarlas en organizaciones privadas. Por 
desgracia, la mayor parte de estas pruebas son 
instrumentos intemos de las empresas que no 
estdn disponiblcs para revisidn general. A pc- 
sar de una resefia precautoria ocasional (p. ej., 
Brannick y cols., 1989), la tdcnica de bandeja 
de entrada aim sc tiene cn alia estima como 
mdtodo podcroso para valorar a candidatos a 
pucstos gcrcnciales. 

CENTROS DE EVALUAa6N 

Un centro de evaluacidn no es tanto un lugar 
como un proccso. Muchas empresas y deparla- 
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memos militares —asf como unos cuantos go- 
biemos progresistas— han dedicado sitios cs- 
peciales para la aplicacidn de tunicas dc bandcja 
de entrada y ejercicios de simulacidn en el en- 
trenamiento y seleccidn dc administradores. El 
propdsilo dc un centro de evaluacidn consis- 
te en valorar el potencial administrativo al ex- 
poncr a los candidatos a multiples (ecnicas de 
simulacidn que incluycn prcscntacioncs en gru- 
po, ejercicios de solucidn de problemas, ejerci¬ 
cios de discusidn grupal. entrevistas y tdcnicas 
de bandcja dc entrada. Tambidn se toman en 
consideracidn para la valoracidn general los re- 
sultados de pruebas tradicionales de aptitud y 
personalidad. Gercntes cxitosos mayores y que 
ticncn entrenamiento especial en tdcnicas de 
observacidn y valoracidn, observan y evaluan 
los diversos ejercicios de simulacidn. Los cen- 
tros de evaluacidn se utilizan en una variedad 
de ambientes que incluyen ncgocios e indus- 
tria, gobiemo y el ejdrcito. No hay duda dc que 
un centro de evaluacidn con el disefto apropia- 
do puede proporcionar una evaluacidn vdlida 
del potencial administrativo. La investigacidn de 
seguimiento ha demostrado que el desempeno 
dc los candidatos en un centro de evaluacidn sc 
correlaciona en gran medida con las caiifica- 
ciones del supervisor para el desempeno en el 
trabajo (Gifford, 1991). Una pregunta que es 
mds diffcil responder es si los centros de eva¬ 
luacidn son eficaces en cuanto a costos en com- 
paracidn con los procedimicntos tradicionales 
de seleccidn. Despuds dc todo, el financiamicn- 


to de un centro de evaluacidn es muy costoso. 
La pregunta clave es si el enfoque de centros 
de evaluacidn para la seleccidn impulsa lo sufi. 
ciente la product! vidad de la organizaci6n como 
para compensar por el gasto del proceso de 
seleccidn. En un sentido aneeddtico, la respuesta 
parecerfa ser un rotundo sf, dado que las deci- 
siones inadccuadas dc los administradores de- 
ficientes pueden ser muy costosas. No obstante, 
cxistcn pocos datos empfricos que respondan 
a csta cuestidn. 

Goffin, Rothstcin y Johnston (1966) com- 
pararon la validcz de las pruebas tradicionales 
de personalidad (con la Personality Research 
Form [Forma de Invesligacidn dc la Pcrsonali- 
dadj, Jackson, 1984b) y del enfoque del centro 
de evaluacidn en la prcdiccidn del desempefio 
administrativo de 68 gercntes cn una compaflfa 
de productos de silvicultura. Ambos mdtodos 
fueron equivalentes en la prcdiccidn del des¬ 
empeno. lo cual sugerirfa que el enfoque de 
centro de evaluacidn no compensa el costo adi- 
cional (muy sustancial). Sin embargo, cuando 
se utilizaron ambos mdtodos en combi nacidn, 
la prueba dc personalidad proporciond un sig¬ 
nificative inercmento de validcz por encima de 
aqudl del centro dc evaluacidn por sf solo. Asf, 
las conclusiones dc las pruebas de personali¬ 
dad y de los centros de evaluacidn contribu- 
yen cada una con informacidn dnica que es 
dtil cn la prcdiccidn del desempeno. El ejem- 
plo dc caso I l-l ilustra un centro de evalua¬ 
cidn en accidn. 



1. La psicologfa industrial y organizational 
(psicologfa I/O) trata sobre la conducta en 
situaciones de trabajo (ncgocios, publicidad 
y el ejdrcito). Los psicdlogos I/O utilizan 
pruebas y evaiuacioncs psicoldgicas para 
propdsitos diversos que incluyen contrata- 
cidn, colocacidn, promocidn y valoracidn. 

2. El andlisis de pucstos consiste en definir un 
puesto en terminos dc las conductas necesa- 


rias para llevarlo a cabo. Estc aniilisis inclu- 
ye dos componentes principalcs: descripcidn 
del puesto (caracterfsticas ffsicas y ambien- 
tales del trabajo) y especificacidn del mismo 
(caracterfsticas personales requeridas). 

3. El Position Analysis Questionnaire, PAQ 
(Cuestionario de andlisis de puestos), e ins- 
trumentos similares proporcionan informa¬ 
cidn cuantiricable pertinente para el andlisis 
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EJEMPLO DE CASOH-1 

ASIGNACI6N DC CARRERA EN CANADA_ 

Gilford (1991) ha descrito ampliamente la manera en que el gotoierno canadiense selecclona 
a sus admlnistradores con un enfoque de centra de evaluacibn que se conoce como Career 
Assignment Program (CAP; Programa de aslgnacidn de carrera). Con base en enlrevistas con 
ejecutivos elicaces, el equipo de investigadbn del CAP determinb 13 atributos vltales para el 
bxito ejecutivo; 

Inleligencia 
Creatlvidad 
Tolerancia al eslrbs 
Motivacibn 
Independencia eficaz 
Uderazgo 

Relaciones Interpersonales 

Para unos cuantos de estos atributos (p. ej., inleligencia, creatlvidad, comunicacibn escrita), las 
pruebas estandarizadas pueden proporcionar una base vblida para la evaluacibn. No obstante, 
la mayor parte de estos atributos sblo pueden valorarse por medio de ejerclcios de simulaclbn 
gerenclal. El equipo de investigadbn del CAP obtuvo como resultado un programa agotador de 
tres dfas que incluyb cinco ejerclcios de simulacibn que se describee mbs adelante. 

Al llegar al centra de evaluatibn, los candidatos reciben materiales por escrito que describen 
una entidad gubemamental hipotbtlca. Cada candidato debe asumir el papel de Jefe ejecutivo 
de una unidad de reciente lormadbn denlro de la entidad de gobierno. El proceso de evaluaclbn 
consiste de una serie de cinco adlvidades y juntas con interacciones simuladas (con adores 
entrenados) que se necesitan para admlnistrar la unidad dentro la entidad; 

* Tarea de bandeja de entrada — respuestas a informes, mensajes telefbnicos y memorandos 
dirigidos al ejecutivo. 

* Junta de personal —el candidato se reune con cualro subordinados para resolver problemas 
que enfrenta la unidad y la entidad. 

* Junta Informatlva —el candidato informa al presidents sobre el estado general de la unidad. 

* Presentacibn presupuestal —presentacibn del presupuesto y previsiones a tres artos, 
presentado a los principals funcionarios financieros. 

* Fuerza de trabajo —el candidato ayuda a estudiar y recomendar soluciones para los problemas 
de la unidad y entidad. 

El personal del CAP observe y valora todas estas activldades y entonces se calillca a los candidatos 
en los 13 atributos antes llstados. Estos datos se utilizan para determiner el potencial administrative 
general. La investigadbn de segulmlento indica que el enfoque de centra de evaluacibn e3 vblldo 
a un nivel de predlcdbn: las califtcaciones del CAP se correlacionaron de manera elevada con 
las callflcaciones del supervisor para el desempefto en el puesto hasta cuatro anos despubs 
(Gifford. 1991). 


Planificaclbn y organlzaclbn 
Capacidad para delegar 
Anblisis y sfntesis 
Juicio 

Comunicacibn oral 
Comunicacibn escrita 


J 
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de puestos. Por ejemplo, el PAQ evalua los 
siguientcs componentes de un puesto: ob- 
lencidn de informacidn, proccsos mentales, 
produclo laboral, rclaciones pcrsonalcs y 
conlexto del puesto. 

4. Las pruebas psicoldgicas puedcn represen- 
tar un papcl importante en la selcccidn de 
personal, pero se les debe utilizar con sen- 
sibilidad hacia las cuestiones de validez 
prcdictiva y prcocupacioncs legates. Los 
psicdlogos I/O necesitan reconocer que 
cs posible que incluso un enfoque dptimo 
de seleccidn no sea v&lido para todos los 
candidatos. 

5. Los datos autobiogrdficos, conocidos como 
datos biogrdficos, poscen validez prcdictiva 
sustancial para muchos tipos de seleccidn 
de personal. En muchos estudios la validez 
prcdictiva de los datos biogrdficos (con va- 
lores en el rango de .50) rivaliza con la de 
las pruebas cstandarizadas. 

6. En la forma en que por lo comun se uliliza 
en la seleccidn de personal, la entrevista 
tiene baja confiabilidad y validez deficicn- 
tc. Sdlo cuando dsta sc disena en forma cui- 
dadosa y tiene fuerte estructura puede 
proporcionar una base confiable y vdlida 
para la seleccidn de personal. 

7. Las pruebas de capacidad cognitiva propor- 
cionan una fuerte base para la seleccidn de 
personal en la mayor parte de las ocupacio- 
nes. Las pruebas de capacidad, cuyo unico 
rival cs la muestra de trabajo, ticncn coefi- 
cientes de validez de .54 en promedio entre 
muchas pruebas y mueslras. 

8. Las pruebas cognitivas que miden capaci¬ 
dad general (g) a menudo predicen mejor 
el desempeno laboral que las medidas de 
capacidades especfficas. La razdn es que la 
mayor parte de los puestos son factorial- 
mente complejos en cuanto a sus requisi¬ 
tes, lo cual garantiza que las medidas de g 
poseerdn elevada validez prcdictiva. 

9. Cuando se les valida para el uso propuesto, 
las pruebas de personalidad y temperamen- 
to pueden proporciona una base util para la 


seleccidn de persona). Por ejemplo, el Hogan 
Personality Inventory, HPI (Inventario dc 
Personalidad Hogan), estd bien validado 
para la prediccidn del desempeno laboral 
en ambientes militares, hospitalarios y cor- 
poradvos. 

10. Las pmebas dc integridad de Idpiz y papcl 
se diseharon para detectar a individuos 
propensos al robo y a otros candidatos in- 
deseables. Algunos de estos instrumentos 
poscen validez predictiva moderada (p. ej., 
medidas basadas en la personalidad), pero su 
ulilizacidn hacc surgir muchas dudas dticas. 

11. La evaluacidn dc las habilidadcs psicomo- 
toras y sensoriales puede ser importante 
para algunas ocupaciones. Por ejemplo, la 
Minnesota Rate of Manipulation Test (Pruc- 
ba Minnesota dc tasa de manipulacidn) pro¬ 
porciona una medida de la destreza de 
dedos-mano-brazo que es util para la inves- 
ligacidn de empleados en una variedad de 
ambientes industrials. 

12. Una muestra dc trabajo es una replica cn 
miniatura del puesto que ha solicitado la 
persona evaluada. Aquella disenada adccua- 
damentc (p. ej.. a los posibles mecdnicos sc 
les podrfa pedir que instalen una polea y 
reparen una caja de velocidades) puede pro¬ 
duct coeficientes de validez en los rangos 
de .40. .50 o .60. 

13. Los ejercicios situacionales, como la prue- 
ba de bandeja dc entrada, se utilizan princi- 
palmente para seleccionar a personas para 
los puestos gcrencialcs y profesionalcs. 
Aunque consumcn mucho tiempo y son 
costosos, estos ejercicios proporcionan una 
base vilida para la seleccidn dc gerentes. 

14. Un centra de evaluacidn se utiliza para eva- 
luar el potcncial gerencial al exponer a los 
candidatos a multiples tdcnicas de simula- 
ci6n, incluyendo presentacioncs de grupo, 
ejercicios de solucidn de problemas, entre- 
vistas y tdcnicas dc bandeja de entrada. Ijjs 
calificaciones del centra de evaluacidn 
ayudan a identificar el talento gerencial dc 
alto nivel. 
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pTERMINOS Y CONCEPTOS CLAVE 

AnSIisis de puestos p. 479 

Dates biograficos p. 483 

Prucbas de integridad p. 494 

Mucslra dc trabajo p. 499 


Ejercicio situacional p. 500 

Prucba de Bandcja de Entrada p. 500 

Centro dc evaluacidn p. 502 





















































































Tema 1 IB 

Valoracidn del desempeno 
en el trabajo 


Funciones de la valoracidn del desempeno 
Enloques para la valoracidn del desempeno 
Fuentes de error en la valoracidn del desempeno 
Cuestiones legates en la evaluacidn I/O 

Ejemplo de caso 11-2. Prdcticas imprudentes de prueba en la 
investigacidn de empleados 
Resumen 

Tdrminos y conceptos clave 




* 



La valoracidn del desempeno en cl tra- 
bajo es fundamental para la opcracidn exitosa 
dc cualquier empresa u organization. En au- 
sencia de realimentacidn significativa, los em¬ 
pleados no ticnen idea de edmo mejorar; sin 
una evaluacidn util, los administradorcs no tie- 
nen idea de edmo manejar al personal. Es di- 
Rcil imaginar la manera en que una corporacidn, 
empresa u organizacidn podrfa alcanzar una 
misidn institucional, sin valorar cl desempeno 
de sus empleados dc una manera u otra. 

Con frccuencia, los psicdlogos industrials 
y organizacionalcs ayudan a disetiar escalas dc 


califtcacidn y otros instrumentos que se utilizan 
para la valoracidn del desempeno (I.andy y Farr. 
1983). Cuando se hace de manera apropiada, la 
valoracidn dc los empleados dcscansa sobre una 
sdlida fundamcntacidn de medidas dc psicologfa 
aplicada —de aquf que se incluya como uno dc los 
principalcs (emas en csic lexto. Adenitis de dar 
una introduccidn a los aspectos cscncialcs en la 
medicidn del desempeno en el trabajo, tambidn 
se tocan de manera breve las muchas cucstio- 
ncs legates que rodean a la selcccidn y estima¬ 
tion del personal. Se comienza con un analisis 
del contexto de la valoracidn del desemperto. 
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(Capitulo 11) 


I FUNCIONES DE LA VALORACI6N 
DEL DESEMPENO 


La valoracidn del desempeno en el trabajo sa- 
tisface muchos propositus institucionales. La 
lista corta incluye ascensos, transferences, des- 
pidos y el cstablecimicnlo dc salarios —todo lo 
cual puede cstar supeditado con esta (area. La 
lista extensa incluye los 20 usos comunes que 
identificaron Cleveland. Murphy y Williams 
(1989): 

Administracidn de salarios 
Ascensos 

Retcncidn o termination 
Reconocimicnto del desempeno individual 
Despidos 

Idenliflcacidn del desempeno dcncientc 
Identification dc las ncccsidadcs individua- 
les de cnlrenamiento 
Realimcntacidn del desempeno 
Determinacidn de transferencias y nombra- 
mientos 

Idcntificacidn de fortalezas y debilidades 
individuates 

Planificacidn de personal 
Determinacidn de necesidades dc entrena- 
miento dc la organizacidn 
Valoracidn del logro de metas 
Asistencia en la identificacidn de metas 
Valoracidn de sistemas de personal 
Fortalecimiento de la estructura de autoridad 
Idcntificacidn de necesidades dc dcsarrollo 
de la organizacidn 

Criterios para investigacidn de validez 
Documentacidn dc decisiones sobre cl per¬ 
sonal 

Satisfaccidn dc requisitos legates 

Estas aplicacioncs dc la valoracidn del desem¬ 
peno se agrupan alrededor de cuatro usos prin- 
cipales: comparacidn de individuos en tdrminos 
de sus niveles generates de desemperio; identi¬ 
ficacidn y utilizacidn dc informacidn acerca de 
fortalezas y debilidades individuates; pucstaen 
marcha y valoracidn dc sistemas de recursos 
humanos en organizacioncs; y documentation 
o justification de decisiones sobre el personal. 


M&s alia de cualquier duda, la valoracidn del 
desempeno cs escncial para el mantenimien- 
to de la efectividad dc la organizaci6n. 

Como pronto descubrir<i el lector, la valo¬ 
racidn del desempefio es un problcma comple- 
jo para el que las soluciones simples y obvias 
son, en general, incorrectas. En parte, la (area 
cs diffcil debido a que los criterios del desem¬ 
peno eficaz pocas veccs son tan explfcitos como 
“cantidad dc artfculos vendidos en ddlarcs" 
(p. ej., para un vendedor) o “porcentaje de 
cstudiantes que aprueban un examen nacio- 
nal” (p. ej., para un maestro). Sin importer 
qud tanto pudicran preferirse los mdtodos efi- 
caces para la evaluacidn de la efectividad dc los 
empleados, a menudo los enfoques basados en 
cl juicio son la unica opcidn prdctica. 

Los problemas que sc enfrentan cuando se 
pone en marcha una valoracidn del desempeno 
se conocen gencralmente, en conjunto, como 
problcma del criterio —una designacidn que 
aparccid por primera vcz en el deccnio dc 1950 
(p. ej., Flanagan, 1956; Landy y Farr, 1983). La 
frasc problcma del criterio intenta trnsmitir las 
dificultadcs implicadas en la conceptuacidn y 
medicidn dc constructs del desempeno que, 
con frecuencia, son complejos, confusos y tnul- 
(idimensionales. Para un andlisis amplio sobre 
este tema, el lector deberia consultar las extensas 
resedas de Austin y Villanova (1992), y Campbell, 
Gasser y Oswald (1996). En la siguientc scc- 
cidn se tocan algunos aspects del problema 
del criterio. 


B ENFOQUES PARA LA VALORACI6N 
DEL DESEMPENO 


Litcralmente existen docenas de enfoques dis- 
tintos al nivel conceptual para la valoracidn del 
desempeno en el trabajo. En la prdctica, dstos 
se descomponen en cuatro clases de informa- 
cidn: medidas del desempeno como los cdlculos 
de productividad; datos sobre cl personal como 
la tasa de ausentismo; calificaciones de com- 
paneros y autocvaluaciones; y valoracioncs del 
supervisor como escalas de calificacidn. Como 
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se analizarf despues, las escalas de calificacidn 
que respondcn los supervisores son, con mu- 
cho, el m£todo preferido de valoracidn del des¬ 
empeno. Pero primcro dcbcn mcncionarse de 
manera breve otros enfoques. 

MEDIDAS Da DESEMPENO 

Las medidas del desempeno incluyen Indices 
aparentcmente objetivos corno el numero de 
ladrillos que coloca un albanil, ganancias lota- 
les de un vendedor o porcentajc de estudianles 
aprobados por un maestro. Aunquc los cAlcu- 
los de production parecerfan los m&odos m<1s 
objetivos y v.ilidos para la mcdicidn del critc- 
rio, existen serios problcmas con este enfoque 
(Guion, 1965), que incluyen: 

* Es posible que la tasa de productividad no es- 
t(5 bajo el control del trabajador. Por ejemplo. 
el cmplcado en una empresa de comida rdpi- 
da sdlo puede vender lo que las personas or- 
denan y el trabajador de una Ifnea de ensam- 
blado sdlo puede avanzar al mismo paso que 
sus companeros. 

* Los cdlculos de produccidn no pueden apli- 
carse a la mayor parte de los empleos. Por 
ejemplo, no existen unidades relacionadas de 
produce i6n para un profesor uni versitario, un 
juez o un recepcionista de un hotel. 

* El dnfasis cn los cdlculos de produccidn pue¬ 
de distorsionar la calidad del rcsultado. Por 
ejemplo, el farmacdutico en un emporio de 
mcdicamcntos por correo puede surtir las rc- 
cetas con los medicamentos incorrectos, si su 
trabajo se valora solamcnte cn funcidn de la 
productividad. 

Otro problema es que los cdlculos de produc- 
cidn pueden ser poco confiables, en especial a 
travds de periodos cortos, y detectar s6lo una 
pequena proporcidn de los requisitos del em- 
plco, incluso cuando pareccn ser cl critcrio de- 
nnitivo. Por ejemplo, el volumen de ventas 
podria parecer el criterio ideal para la mayor 
parte de los puestos de ventas; no obstante, un 
vendedor puede elcvar sus ventas al mentirso- 


bre las cualidadcs de los productos de la com- 
pani'a. Las ventas pueden ser muy elevadas du¬ 
rante varios afios —hasta que los consumidorcs 
insatisfcchos demanden a la empresa. Con se- 
guridad, la productividad es importante en este 
ejemplo, pero la corporacidn tambidn deberfa 
quercr que se evaluen factorcs interpcrsonalcs 
como la honestidad en las relaciones con el 
cliente. 


DATOS SOBRE EL PERSONAL: 
AUSENT1SMO 

Los datos del personal como la tasa de ausen- 
tismo proporcionan otra base posible para la 
valoracidn del desempeno. Con toda seguridad, 
los empleadores tienen buenas razoncs para 
vigilar el ausentismo y rcducirlo a travds de in¬ 
centives apropiados. Steers y Rhodes (1978) 
calculan que cl ausentismo cuesta cerca de j 25 
mil millones de ddlares cada ano en producti¬ 
vidad perdida! No es sorprendente que cl 
ausentismo sea una medida atractiva de crite¬ 
rio que se ha investigado de manera extensa 
(Harrison y Hulin, 1989). 

Pordcsgracia, el ausentismo resulta ser una 
medida gencralmcnte inutil del desempefio en el 
trabajo, cxcepto en casos extremes de ausen- 
cias injuslificablcs flagrantes. Uno de los prin- 
cipales problcmas es su definicidn. Landy y Farr 
(1983) listan 28 catcgonas de ausentismo, mu- 
chas de las cuales no tienen correlacibn con las 
demds. Diferentcs lipos de ausentismo inclu¬ 
yen cl programado contra el no programado, 
autorizado contra no autorizado, justiftcado 
contra injustificado, contractual contra no con¬ 
tractual, enfermedad contra no enfermedad. 
mddico contra personal, voluntario contra in- 
voluntario, explicado contra no explicado, con 
compcnsacidn contra sin compensacidn, enfer¬ 
medad certificada contra enfermedad eventual, 
ausencia de Lunes/Viemes contra auscncia a 
mitad de semana, c informado contra no informa- 
do. ^Cudndo estl realmente ausente del trabajo 
el empleado? Los criterios son muy evasivos. 

AdemSs, el ausentismo resulta ser una va¬ 
riable atrozmentc poco confiable. Las correla- 
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clones test-retest (tasas dc trabajadores auscn- 
tes de dos pcriodos de extensidn iddntica) son 
tan bajas como .20, lo cual significa que los 
empleados presentan tasas muy variables de un 
pcriodo al siguientc. Un problcma relacionado 
con el ausentismo es que los trabajadores tien- 
den a informarlo pocas veccs cn su propio caso 
y lo hacen en extreme en el caso de los denies 
(Harrison y Shaffer, 1994). Por ultimo, para la 
mayorfa de los trabajadores, las tasas son bas- 
tantc bajas. Bn pocas palabras, el ausentismo 
es un mdtodo dcficiente para evaluarcl desem- 
peiio del trabajador, excepto para un pcqueno 
porcentaje con ausencias injustificadas constan- 
temente. 

CAUFICACIONES DE COMPANEROS 
Y AUTOEVALUACIONES 

Algunos investigadores han propueslo que las 
calificacioncs de companeros y las autoeva- 
luacioncs son sumamente vdlidas y constituyen 
un complemento importante para las califica- 
ciones del supervisor. Gran cantidad de inves- 
tigaciones tratan sobre csta cucstidn, pero a 
menudo los resultados son confusos y contra¬ 
dictories. No obstante, es posible listar varias 
gcneralizaciones (Harris y Shaubroeck. 1988; 
Smither, 1994). 

• Los companeros dan calificacioncs mils in- 
dulgentes que los supervisorcs. 

• La correlacidn entre las autocalificaciones y 
las calificaciones del supervisor es minima. 

• La correlaci6n entre las calificaciones de com¬ 
paneros y las del supervisor es moderada. 

• Los supervisorcs y subordinados lienen dife- 
rentes ideas sobre aquello que es importante 
en el trabajo. 

En general, los estudiosos concluyen que las 
calificaciones de companeros y las autoeva- 
luaciones pueden tener una aplicacidn limitada 
con propdsilos como el desarrollo personal, 
pero su validez no se ha establecido aun de 
manera adecuada como para justificar su utili- 
zacidn generalizada (Smither, 1994). 


ESCALAS DE CAUFICACI6N 
DEL SUPERVISOR 

Las escalas de calificacidn son la medida mis 
comun del dcsempeno en el trabajo (Landy y 
Farr, 1983; Muchinsky, 1990). Estos instrumen¬ 
ts varfan desde las simples formas grgficas 
hasta escalas complcjas vinculadas con conductas 
concretas. En general, las escalas de califica¬ 
cidn del supervisor rcvclan s6lo una conllabi- 
lidad regular, con un cocficiente promedio dc 
confiabilidad intercalificadores dc .52 a travls 
de muchos diferentes enfoques y cstudios 
(Viswesvaran, Ones y Schmidt, 1996). A pesar 
dc su dibit confiabilidad, las calificaciones del 
supervisor todavfa figuran como el enfoque de 
mis uso. Cerca de tres cuartos de todas las va- 
loraciones del desempeno dependen de meto- 
dos basados cn cl juicio como las escalas de 
calificacidn del supervisor (Landy, 1985). 

La escala dc calificacidn mils simple es la 
escala de calificacidn grafica, introducida por 
Donald Paterson en 1922 (Landy y Farr, 1983). 
Una escala dc calificacidn grafica consistc en 
etiquetas de rasgo, definiciones breves dc di- 
chas etiquetas y un continuo para la calificacidn. 
Como el lector observard en la figura 11—I, se 
han utilizado diversos tipos de escalas dc cali¬ 
ficacidn grafica. 

La popularidad de cstas escalas se debe, 
en parte, a su sencillez; pero esto tambicn es 
una de sus principales debilidades debido a que 
la dimensidn de dcsempeno laboral que se va- 
lora puede haberse definido de manera vaga. 
La insatisfacci6n con las escalas de calificacidn 
grdfica condujo al desarrollo de muchos enfo¬ 
ques alternativos para la estimacidn del desem¬ 
peno. como se analiza a continuacidn. 

Una lista de verificacidn dc incidcntes 
criticos se basa en episodios reales de conduc- 
ta dcseablc e indeseable en cl trabajo (Flanagan, 
1954). Por lo comun, la persona que desarTolla 
una lista de verificacidn le pedira a los emplea¬ 
dos que construyan el instrument al presentar 
cjcmplos especificos de conducta laboral desea- 
ble e indeseable. Por ejemplo, supdngase que 
se ticne cl propdsito dc desanollar una lista dc 
verificacidn para cstimar cl desempedo de los 
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Figura 11-1, Ejemptos da escalas da calilicacton grafica. 


consejeros residentes (CR) en un dormitorio 
univcrsitario. Si se sigue como modclo un estu- 
dio de Aamodt, Keller, Crawford y Kimbrough 
(1981), se les podria hacer la siguiente petition 
a los CR acluales del dormitorio: 

Considere al mejor CR que usted haya 
conocido alguna vez. Por favor describa 
en detalle varios incidentes que rcflejen 


por qu6 esta persona fue el mejor conse- 
jero. Por favor haga lo mismo con el peor 
CR que haya conocido. 

Con base en cientos dc conductas nominadas, 
los autores de la lista de verificacidn deben 
proseguircon una condcnsacidn y codificacidn 
de estos incidentes para obtencr un numcro 
mds pequeno dc conductas rclacionadas, tanto 


































512 • Evaluacidn psicologica: Hlstoria, principles y aplicaclones 


(Capitulo 11) 


dcscables como indeseables. Por cjcmplo, los 
siguientes reactivos podn'an ser adecuados para 
la lista de verificacidn de CR: 

-permanccc cn cl dormitorio m3s de 

lo requerido. 

-rompe las regias del dormitorio. 

-es justo cn relacidn con la disciplina. 

-planea programas cspeciales. 

-no disciplina a sus amigos. 

-con frecuencia cs poco amistoso. 

-muestra preocupacidn acerca de los 

residentes. 

-parece autoritario. 

Por supucsto, la lista coinplcta de verificacidn 
serfa mucho mds larga que dsta. El supervisor 
de los CR respondent a cste instmmento como 
una base para la estimacidn del desempeiio. De 
ser necesario, se puede extracr una calificacidn 
total de resumen a partir de ponderaciones apro- 
piadas de los reactivos individuates. Harvey 
(1991) analiza las ventajas y desventajas de estc 
enfoque. 

Otra forma de medida de juicio referida al 
critcrio es la Behavirally AnchoredRaitin Scale ; 
BARS (eseala de clasificacion con base 
conductual). El trabajo caracterfstico sobre las 
BARS precede de Smith y Kendall (1963). Es- 
tos autores propusicron un procedi mientocom- 
plcjo de desairollo para producirjuicios referidos 
al critcrio. El procedimicnto uliliza a varios ex- 
pertos para identificar y definir dimensiones de 
desempeiio, gencrar ejemplos conductualcs y 
dar una eseala significativa a las conductas. En 
general, el procedimiento es bastante complc- 
jo, consume mucho tiempo y es costoso. Se 
han sugerido numcrosas variaciones y mejo- 
rtas (Harvey, 1991). Una ventaja de las BARS y 
de otras escalas basadas en la conducts es su 
estricta sujccion a las pautas de la EEOC (Equal 
Employment Opportunity Commission [Comi- 
sion dc Oportunidad Equitaliva de Empleo]) que 
se analizait posteriormente en esle capitulo. Las 
BARS y los enfoques relacionados se centran 
en las conductas mis que cn las caractcrlsticas 
de personalidad o de actitud. En la figura 11-2 
sc presenta una eseala con base conductual para 


el desempeiio laboral de un supervisor de ven- 
tas. Por supuesto, la valoracidn profunda de un 
gerente de ventas me him a escalas adicionalcs 
para olros aspectos del puesto. 

La investigacidn sobre edmo mejorar la 
prccisidn dc las calificaciones con las BARS 
ha dado rcsultados combinados. Algunos cstu- 
dios encuentran mcnos crrorcs dc calificaciin 
—cn especial una rcduccidn en la indulgcncia 
injustificada cn las valoraciones— mientras 
otras no ven mejorfa con las BARS en compara- 
ci6n con otros mdtodos de valoracidn (Murphy 
y Pardaffy, 1989). En general, Muchinsky 
(1990) concluye que el enfoque de las BARS 
no cs mucho mejor que las escalas dc califica- 
ci6n grifica cn la reduce ion dc crrorcs dc cali- 
ficacidn. No obstante, el proceso dc desarrollo 
dc eseala de las BARS puede tener bcncficios 
indirectos en cuanto a que obliga a los supervi¬ 
sors a prestar atencidn estrecha a los com- 
ponentes conductuales del desempeiio eficaz. 

Una Behavior Observation Scale, BOS 
(Eseala de Observation Conductual), cs una 
variacidn dc la tdcnica de las BARS. La dife- 
rencia entre ambas es que el enfoque dc la BOS 
utiliza un continuo desde “casi nunea” hasta 
“casi siempre", para medir la frecuencia con 
la que se desempeiia un cmplcado en una tarea 
especlfica en cada dimension conductual. Como 
ocurre con la tdcnica de las BARS, los investi- 
gadorcs cucstionan si las escalas dc observa- 
cidn conductual merecen el esfuerzo adicional 
(Guion, 1991). 

Una eseala de election forzosa se disena 
para eliminar el prcjuicio y la subjetividad en 
las calificaciones del supervisor al forzar una 
eleccidn entre opciones que son iguales en cuanto 
a caractcrlsticas socialmente dcscables. En teorfa, 
estc enfoque hace imposible que el supervisor 
incline las calificaciones debido a prcjuicio o 
subjetividad. Se utilizard la investigaci6n lldcr 
de Sisson (1948) para ilustrar las caractcrfsti- 
cas de este enfoque. Estc autor dcsarrolld una 
eseala para valorar a oficialcs del ejdrcito que 
consistla en tdtradas de descripciones conduc¬ 
tuales. Cada una contem'a dos reactivos positivos 
y dos negativos cquiparados en cuanto a cuali- 
dades socialmente deseables. Los cuatro 





Evaluation Industrial y organizational • 513 




9 


ge puede esperar que proporcione confianza y un luerle 
ftnildo de responsabilidad a su personal de ventas al 
dslegarte mochoa trabajos Importantes 


7 


Se puede esperar que leve a cabo una cilntca de ventas 
de un dla completo con dos nuevos miembros del 
personal de ventas y, por Unto, tos ayude a desarrotlarse 
como las personas con el desempefto mas alto en ventas 
denlro del daparlamento. 


Se puede esperar que nunca deje de reatotar reuniones 
de entrenamlento con su gente do manera semanal en 
horartos programados y que les Irasmlta exactamente 
to quo espora 


Se puede esperar que exhiba cortesla y respeto hacia 
su personal do ventas 


6 


Se puede esperar que le recuerde a su personal de 
ventas que atienda a la dlentela en vez de conversar 
unos con otros 


Se puede esperar que sea bastante crltlco de tos 
Mtindares de la lienda (rente a su propla gente y que 
con e*o se arriesgue a desarrollar actrtudes negativas 


Se puede esperar que le dlga a un indlvlduo que se 
presente de todos modos, aunque haya llamado para 
avisar que esta enfermo 


Se puede esperar que se retracte de una promesa hectia 
a un individuo al que le ha dtobo que lo puede transient 
de regreso a un departs me nto anterior, cuando a dicha 
persona no le agrada el nuevo depariamento. 


2 


Se puede esperar que haga advertencias a un Individuo 
acerca de que su salarlo se puede basar en las ventas 
del dopartamento, aunque sabe que lal prdctica va en 
1 __l_ contra de las polflicas de la compahla. 


Flgura 11-2. Escala de calificacibn con base conductual para supotvisores de ventas. 

Fuente: Reimpreso con autorizacibn de Campbell. J. P., Dunnette, M.D., Arvey, R. D. y Hellervik, L. V. (1973). The 
development and evaluation o( behavlorally based rating scales. Journal ol Applied Psychology, 57, 15-22. 


reactivos en cada tetrada se relacionaban temd- 
ticamcntc con una sola dimcnsidn de dcscmpc- 
fio. Sin que lo supieran los supervisores que 
rcspondfan a la escala de califtcacidn, uno de 
los dos elcmcntos positivos se consideraba 


como muy descriplivo de los oficiales eficien- 
tes del cjbrcito y el otro se juzgaba como me- 
nos descriptivo. De la misma manera, uno de 
los dos reactivos negativos se juzgaba como miis 
descriptivo de los oficiales ineficicntes del ejdr- 
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cito que el otro. A continuaci6n se presenta una 
tdtrada de muestra (Borman, 1991): 

Mis Me nos 

descrip- descrip- 
tivo tivo 

A. No puede asumir 

rcsponsabilidadcs_ 

B. Sabe c6mo y cuindo 

delegar responsabili- 

dadcs . _ 

C. Ofrece sugerencias_ 

D. Cambia de idea con 

demasiada facilidad _ _ 

Se pidid a los supervisores que rcvisaran los 
reactivos en cada tdtrada y que marcaran uno 
de ellos como cl mis descriptivo y otro como 
el mcnos descriptivo del oficial al que se valo- 
raba. Se concedfa una puntuacidn de +1 para la 
rcspuesta de “mis descriptivo” cn el reactivo 
con codificacidn positiva (en este caso la alter¬ 
native B) o de “menos descriptivo” para aqudl 
con codificacidn negativa (en este caso la al- 
tcmativa A), mienlras que se daba una puntua- 
cidn de -1 para la respuesta de “menos 
descriptivo” en el reactivo con codificacidn po¬ 
sitiva o de “mis descriptivo” en aqudl con co- 
dificacidn negativa. La respuesta a las reactivos 
no codificados (altemativas C y D) como mis o 
menos descriptivos obtenfa una puntuacidn 
de 0. Asf, cada tdtrada produefa un continuo de 
puntuaciones de cinco puntos: +2, +1, 0, -1, -2. 
La puntuacidn total que sc utilizaba para la 
valoracidn del desempeno consislfa en la suma 
algebraicade los reactivos individuates. 

En realidad, cl enfoque de eleccidn forzo- 
sa nunca ha tenido gran dxito, debido en gran 
medida al csfuerzo que se requierc para la cons- 
truccidn de la eseala. Esto es desafortunado, ya 
que cl mdtodo s( reduce de manera eficaz el 
prejuicio injustificado. Borman (1991) consi- 
dcra este enfoque una “altemativa osada” que 
produce una eseala de calificacion relativamen- 
te objetiva. 


■ FUENTES DE ERROR EN LA 

valoraci6n Da desempeno 


El problema mis diffcil en la valoracidn del de¬ 
sempeno en cl trabajo es la defmicidn adecuada 
de los criterios de cstimacidn. Si un supervisor utt- 
liza un instrumento disenado de manera deficien- 
te que no detecta las dimensiones apropiadas de 
conducta laboral, entonces casi por definicidn la 
valoracidn del desempeno seri imptecisa, incom- 
pleta y errdnea. Sin duda, cl fracaso para iden- 
lificar los criterios apropiados del desempeno 
aceptable c inaccptable es una de las principa- 
les fuentes de error en la valoracidn del mismo. 
Pero dsta no es la unica fuente. Incluso cuando 
los supervisores tienen acceso a medidas exce- 
lentes y bien disehadas, pueden presentarse cn 
cllas varios errores sutilcs. A continuation sc 
analizan Ires de dichas fuentes adicionalcs de 
error de calificacidn: cl cfccto de halo, el sesgo 
del calificador y la contaminacidn del criterio. 

EFECTO DE HALO 

La tendencia a calificar alto o bajo a un cmplca- 
do en todas las dimensiones debido a una im- 
presidn global se denomina cfecto de Halo. La 
invcstigacidn sobre este efecto se puede ras- 
trear hasta principios del siglo XIX (Thorndike, 
1920). El mis comun es el efecto positivo de 
halo. En este caso, un empleado rccibe una ca- 
lificacidn superior a la que merecc porque su 
supervisor no puede ser objetivo cuando califi- 
ca aspectos especfficos de la conducta de di- 
cho empleado. En general, un efecto positivo 
de halo se debe a la general izacidn excesiva de 
un elemento de la conducta del trabajador. Por 
ejemplo, un empleado con asistencia pcrfccta 
puede recibir valoraciones mayores a las que 
merecc en productividad y calidad del trabajo 
—aunque la asistencia no se relaciona de ma¬ 
nera directa con estas dimensiones laborales. 

Smither (1994) lista los siguientes medios 
para controlar los efectos de halo: 

• Proporcionar entrenamiento especial a los 
calificadorcs. 
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• Supervisar a los supcrvisores durante la cali- 
ficacidn. 

• practical' simulacros antes dc rcalizar las ca- 
lificaciones. 

• Llevar un diario sobrc la informacidn re- 
lacionada con la cstimacidn. 

• Proporcionar a los supcrvisores una breve 
pldtica sobre los efectos de halo. 

Goldstein (1991) examina enfoques adiciona- 
les para cl entrenamiento de los calificadorcs. 
Puedc encontrarse un fascinantc analisis sobre 
la naturaleza y consccucncias del error de halo 
cn Murphy, Jako y Anhalt (1993). Contrario al 
prejuicio reinantc cn contra de los errores de 
halo, estos investigadores concluyen que el 
efccto de halo no necesariamcntc disminuye la 
prccisidn de las calificacioncs, y scrialan que, a 
menudo. un supucsto efccto dc halo es el 
subproducto de una verdadera superposicion en 
las dimcnsioncs que sc califican. No es proba¬ 
ble que cl debate sobre dicho efecto se rcsucl- 
va pronto (Arvcy y Murphy, 1998). 

SESGO DEL CAUFICADOR 

Las fucnles potcnciales de sesgo del califica- 
dor son tan numcrosas que aquf sdlo pueden 
mencionarsc algunos cjcmplos destacados. Los 
errores de indulgencia o severidad ocurren 
cuando un supervisor tiendc a calificar a los 
trabajadores cn los cxlremos de la escala. La 
indulgencia tambidn es el producto de factores 
extemos como el atractivo de un emplcado. Los 
errores de severidad se refieren a la prdctica dc 
calificar todos los aspectos del desempeno como 
deficicntes. En contrastc, los errores dc tenden- 
cia central se presentan cuando cl supervisor 
califica a todos como cercanos al promedio en 
todas las dimensiones dc desempeno. Los erro¬ 
res contextuales ocurren cuando el calificador 
valora a un empleado en el contexto de otro, en 
vez de basarsc cn cl desempeno objetivo. Por 
cjcmplo, la presencia de un vendedor obsesio- 
nado con su trabajo, el cual tiene un volumen 
dc ventas extremadamentc alto, podrfa causar 
Que el supervisor de ventas califique al rcsto 


del personal dc ventas con menos de lo que se 
merece. 

Recientemente, los investigadores han pres- 
lado considerable alcncidn a los posiblcs efectos 
sesgados del agrado o desagrado que siente un 
supervisor hacia un subordinado. Es sorprenden- 
te que la tendencia dc las conclusiones es que el 
afecto del supervisor (agrado o desagrado) hacia 
cmplcados cspecfficos no introduce sesgo del 
calificador. En general, cl afccto fuertc en cual- 
quier direccidn representa informacidn vdlida 
sobre un emplcado. As(, es frecuente que las ca- 
lificaciones dc afccto se correlacionen cn gran 
medida con las del desempefio, pero csto se debe 
a que ambos son consecucncia de qud tan bicn 
o que tan mal se desempeiia cl emplcado cn el 
pucsto (Ferris, Judge, Rowland y Fitzgibbons, 
1994; Varma, DcNisi y Peters, 1996). Otras 
formas de sesgo del calificador se analizan en 
Goldstein (1991) y en Smither (1994). 

CONTAMINAaON Da CRITERIO 

Sc dice que la contamination del critcrio cxistc 
cuando una medida de criterio incluye factores 
que no son parte dcmostrable del trabajo (Borman, 
1991; Harvey, 1991). Porejemplo, si una me¬ 
dida del desempeno incluye la apariencia, dste 
muy probablcmentc serfa un caso dc contami- 
nacidn del critcrio —a menos que la apariencia 
fuera relevante para cl dxito en el trabajo. De la 
misma mancra, valorar a un emplcado cn cuan- 
to a “trato con cl publico” serfa apropiado sdlo 
si el puesto requicre cn rcalidad de que dste Ira¬ 
te con el publico. Goldstein (1992) dcstaca ties 
tipos dc contaminacidn del criterio: 

1. El sesgo de oportunidad ocurre cuando los 
trabajadores ticnen diferentes oportunidadcs 
de dxito, como cuando sc asigna a un ven¬ 
dedor a un vecindario de altos ingresos y 
otros deben buscar sus ventas en dreas rura- 
les aisladas. 

2. El sesgo de caracterfsticas grupales estd pre- 
sente cuando estas afectan al desempeno in¬ 
dividual, como cuando los trabajadores en 
la misma unidad Megan a un acuerdo de li- 
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mitar su productividad para conservar rela- 
ciones sociales positivas. 

3. El scsgo dc conocimiento del medio de pre- 
diccion ocurrc cuando un supervisor permi- 
te que sus conocimientos personales sobre 
el emplcado inclinen la cstimacidn, como 
cuando la calidad de la universidad a la que 
asistid una nueva empleada afecta la evalua- 
ci6n que sc hace de ella. 

La atencidn cuidadosa en el andlisis de puestos 
como base para la seleccidn de los criterios de 
valoracidn es la mejor manera de reducir los 
errores en la valoracidn del desemperto. Ade- 
mds, los emplcadores dcbcn seguir cieitas pau- 
tas, como se analiza enscguida. 

PAUTAS PARA LA VALORACI6N 
DEL DESEMPENO 

La valoracidn del desemperto es una tarea co- 
losal. Los cmpleadores no sdlo debcn prestar 
atencidn a la solidez psicomdtrica de su enfo- 
que, sino tambidn deben disefiar un sistema 
prdctico que satisfaga las metas dc la organiza- 
cidn. Por cjemplo, las normas de la valoracidn 
deben ser suficientemente diffeiles y detalladas 
como para garantizar que se logren las metas 
dc la organizacidn. Otra prcocupacidn es que 
la valoracidn del desemperto se encuentre den- 
tro de los Ifmites del Tftulo VII del Decreto de 
1964 sobre derechos civiles. Por tanto, los 
empleadores dcbcn dcsarrollar sistemas equi- 
tativos que no discriminen debido a la raza, sexo 
y otras categorfas protegidas. Para complicar 
las cosas, estas normas —solidez, cucstiones 
practicas y legalidad— pueden entrar en con- 
flicto entre sf. Es posible que el enfoque prdeti- 
co no sea ni sdlido en tdrminos psicomdtricos 
ni legales. A menudo, los mdtodos dc valora¬ 
cidn que muestran las mejores caracterfsticas 
de mcdicidn (p. ej., fuerte confiabilidad in- 
tercalificadores) no evaluaran los aspectos mds 
importantes del desemperto, es decir, no son 
practicos. Estc es un tema familiar dentro del 
campo dc la medicidn. Con demasiada frecuen- 
cia, los psicdlogos deben optar entre rigurosi- 
dad y pcrtinencia, y en pocas ocasiones logran 


obtenerlas al mismo tiempo. Por ultimo, deben 
tomarsc en cuenta las consideraciones legales 
cuando se exploran los Ifmites de la valoracidn 
del desemperto. 

Smither (1994) ha publicado pautas para 
cl dcsarrollo dc sistemas dc valoracidn del des¬ 
emperto que se parafrasean aquf: 

• Base la valoracidn del desemperto en un and- 
lisis cuidadoso de puestos. 

• Desarrolle criterios de valoracidn especfficos, 
libres dc contaminacidn, a partir del andlisis 
de puestos. 

• Determine que el instrumento utilizado para 
calificar el desemperto sea apropiado para la 
situacidn de valoracidn. 

• Entrene a los calificadores para que scan pre- 
cisos, justos y legales en su utilizacidn del 
instrumento de valoracidn. 

• Emplec valoraciones del desemperto a inter- 
valos regulares de seis meses a un arto. 

• Valore dc manera periddica el sistema de va¬ 
loracidn del desemperto para determinarsi de 
hecho logra mejorar el desemperto. 

El entrenamiento dc los calificadores es una pau- 
ta de especial importancia. Un sistema de valo¬ 
racidn que le parece perfectamente directo a un 
empleador, a un calificador no entrenado puede 
causarle confusidn, lo cual resulta en un sesgo 
en las valoraciones. Borman (1991) senala que 
dos tipos de entrenamiento del calificador son 
eficaces: el entrenamiento en errores, en cl que 
el enlrenador simplcmcntc busca alertar a los 
calificadores acerca de tipos especfficos de error 
(p. ej., efecto de halo); y el entrenamiento de marco 
de referenda, en el que el entrenador familianza 
a los calificadores con el contenido especffico 
dc cada dimensidn de desemperto. La investi- 
gacidn indica que cstos tipos de entrenamiento 
mejoran la precisidn de las calificaciones. 

I CUESTIONES LEGALES 
EN EVALUACI6N I/O 


Casi todos los aspectos de la rclacidn de traba- 
jo esdn sujetos a la ley: reclutamiento, investi- 
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gacitin, seleccidn, colocacion, compensaci6n. 
promoci6n y valoracibn del desempeno caen 
dentro del dominio de las intcrpretacioncs le- 
gales (Cascio, 1987). No obstante, los tribuna¬ 
ls y cuerpos legislativos han reservado un 
escrutinio especial para las pruebas relaciona- 
das con el empleo. El profesional que se niega 
a conoccr las pautas legates pertinentes en cuan- 
to a pruebas dc personal lo hace bajo un gran 
riesgo, ya que las pr&cticas imprudentes puc- 
den conducir a litigios costosos y largos (ejem- 
plo de caso 11-2). 

Las pruebas dc personal son particularmen- 
te sensiblcs debido a que las consccuencias dc 
una decision adversa son, a menudo. graves: 
El solicitante no obtiene el empleo o un em- 


pleado no logra un ascenso o colocacion de- 
seados. En reconocimiento a que las pruebas 
de empleo tienen una funcibn sensible como 
guardianes que protegen el beneftcio econbmi- 
co, el Congreso de EUA ha aprobado leyes que 
regulan de manera estricta el empleo de las 
pruebas. Los tribunates tambibn han emitido 
deeisiones que ayudan a definir lo que cs una 
discriminacibn parcial de prueba. Ademas, los 
cuerpos reguladores han publicado pautas que 
tienen un impacto sustancial sobre las prbeti- 
cas de prueba. En este tema se proporcionard 
una perspectiva actual sobre la rcgulacibn dc 
las pruebas para el personal al seguir el desa- 
rrollo de las leyes, reglamentos y principales 
casos judiciales. 


EJEMPLO DE CASO 11-2 

prAcdcas imprudentes de prueba en la investigaci6n de empleados 


Segun la Intormacibn de Prensa Asociada del 11 de julio de 1993, la cadena de descuento 
Target llegb a un acuerdo fuera del tribunal en una demanda colectiva presentada en beneficio 
de un eslimado de 2 500 sollcitantes de empleo. A los futuros guardias de seguridad de Target 
se les pedfa que tomaran la Rodgers Psychscreen (Psicodeteccibn Rodgers), una comblnacibn 
condensada de 704 reactivos del CPI y del MMPI. Varios solicitantes estuvieron en desacuerdo 
para responder la prueba, la cual incluln preguntas sobre Dios, sexo y movimienlos intestinales. 
Target acordd pagar 1.3 mlllones de dblares, Incluyendo $60 000 a cuatro demandantos 
nombrados en la demanda. Aunque Target no admitib alevosfa en el caso, los funcionarios de la 
corporacibn aceptaron no utilizar la prueba Psicodeteccibn durante, cuando menos, cinco anos. 

Sibi Soraka (ue uno de los demandantes. Consideraba que las preguntas eran “descabelladas 
y raras". Afirmb que el efecto acumulativo de responder a las preguntas lo haefa parecer 
palpablemente enfermo. Ariadib: ‘No se necesita ser Einstein para darse cuenta de que estas 
preguntas no tienen en realidad injerencia para nuestro mundo y vida de la actualldad, o con 
toda seguridad para un trabajo que requiere que se camine por todos lados buscando ladrones 
de tiendas". La corporacibn Target defendib sus prbcticas de prueba, seftalando que la 
Psicodeteccibn se utilize de manera comun en la valoracibn de oficiales dedicados al cumplimiento 
de la ley. Los abogados de Soraka estuvieron en desacuerdo y citaron la falta de evidencia de 
que la prueba ayudara a identilicar a personas que fueran buen riesgo contra aquellas que son 
mal riesgo de empleo. Sefialaron que se le negb el empleo a cerca de 800 de los 2 500 solicitantes 
con base solamente en los resultados de la Psicodeteccibn. 

Este caso ilustra que la solldez psicombtrica de un Instrumento no es el unico criterio en la 
seleccibn de una prueba. Adembs, los usuarios de pruebas deben demostrar que el instrumento 
es pertinente para su aplicacibn. Asimismo, deben considerarse las cuestiones de acepta- 
bilidad para los posibles examinandos. 
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El lector podrfa sorprenderse dc saber que 
las pruebas para empleo ban hecho surgir con- 
Iroversias legales s6lo en los ultimos 35 anos 
(Arvcy y Falcy, 1988). Durante cstc periodo, 
varias dccisiones judicialcs definitivas y direc- 
livas gubemamentales que han marcado pauta, 
han ayudado a definir las tcndencias legales 
actuates. Estos hitos se presentan en el cuadro 
11-10, comcnzando con el Decrcto dc 1964 so- 
bre dcrechos civiles, a travds de los reglamentos 
fcdcralcs de la Equal Employment Opportunity 
Commission, EEOC (Comisidn de Oportunida- 
des Equitativas de Empleo), hasta concluir con 
los casos judiciales y avances legislatives mas 
rccicntcs. Estos hitos se revisardn en orden 
cronoldgico. 

PRIMEROS CASOS JUDIC1ALES 
Y LEGISLACI6N 

Durante la presidcncia dc Lyndon B. Johnson, 
el Congreso dc EUA aprobd cl Dccreto de 1964 
sobre derechos civiles. Esta primera legislation 
tu vo un prof undo efecto sobre los proccdimien- 
tos de prueba para cl empleo. Ademds dc dis- 
posiciones amplias disenadas para impedir la 
discriminacidn en muchos contcxtos sociales, 
el Tftulo VII de este Decrcto prohfbc que las 
prdcticas de contratacidn discriminen con base 
en la raza, color, rcligidn, sexo u origen nacio- 
nal. El Decrcto cstablecid varios principios ge- 
nerales importantes que se relacionan con las 
pruebas de empleo (Cascio, 1987): 

• El dccreto prohfbe la preferencia discrimina- 
toria por cualquier grupo, minoritario o ma- 
yoritario. 

• El empleador tiene la carga dc la prueba de 
que todos los requisitos para cl empleo, in- 
cluycndo las puntuaciones de evaluacidn, sc 
relacionan con cl desempefio en el puesto. 

• Las pruebas desarrolladas a nivcl profcsional 
que se utilicen en la evaluacidn del perso¬ 
nal deben rclacionarsc con el trabajo. 

• Adenitis de prohibir la discriminacidn abierta 
y deliberada, la ley prohfbe las prdcticas que 
son equitativas en cuanto a forma, pero 
discriminatorias en cuanto a operacidn. 


Cuadro 11-10. Principales hitos legates 
en las pruebas para empleo 


1964 Myart contra Motorola. Esle caso establecid 
el precedente para que los tribunales alien, 
dan casos sobre pruebas para empleo. 

1964 Decreto de los Derechos Civiles. Este de- 
creto prohfbe la discriminacidn laboral ba- 
sada en sexo, raza, color, religidn u origen 
nacional. 

1966 Paulas de la EEOC. Primeras paulas publi- 
cadas sobre prdcticas de prueba para empleo. 

1971 Griggs contra Duke Power. La Suprema 
Code dictamind que los resultados de una 
prueba para empleo deben tener un lazo 
demostrable con el desempeho en el puesto. 

1973 EUA contra Georgia Power. El dictamen 
fodalecid la autoridad de las paulas de la 
EEOC para los estudios de validez de las 
pruebas de empleo. 

1975 Albemarle contra Moody. Se (odalecen las 
pautas de la EEOC; se dictamina que las ca- 
lificaciones subjetivas de supervisores 
son una base deficiente para validar pruebas. 

1976 Washington contra Davis. La code dicta¬ 
mind que el desempeno en un programs 
de entrenamiento constitufa una base su- 
ficienle contra la cual validar una prueba. 

1978 Pautas uniformes para la seleccidn al em¬ 
pleo. Estas pautas definieron el impacto 
adverso mediante la regia de cuatro quintas 
pades e incoiporaron critenos para la validez 
de los estudios de seleccidn de empleados. 

1988 Watson contra el Fort Worth Bank and 
Trust. El tribunal dictamind que pueden 
validarse instrumentos subjetivos para 
empleo como la entrevista; los empleados 
pueden reclamar que existe un impacto 
desigual con base en polfticas de promo- 
cidn basadas en entrevistas. 

1990 Decreto sobre los Estadounidenses con 
Discapacidades. Este decreto limita de 
manera estricta las razones para no contra- 
tar a una persona con discapacidad. Una 
medida es que no pueden aplicarse prue¬ 
bas mddicas antes de ofrecer un empleo. 

1991 Decreto de los Derechos Civiles. Este decre¬ 
to prohfbe las normas de subgrupo para 
las pruebas de seleccidn de empleados. 
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• La intencidn cs irrclcvante: el dcmandantc no 
necesila demoslrar que la discriminacidn fue 
intencional. 

• A pesar de las limitaciones antcriorcs, las prue- 
bas y otros instrumentos de mcdicidn rcla- 
cionados con cl trabajo se consideran tanto 
legates como utiles. 

La legislacidn de 1964 tambidn crc6 la Comi- 
sidn de Oportunidad Equitativa de Emplco 
(EEOC) para dcsarrollar pautas que definieran 
los procedi mien tos imparciales de seleccidn de 
emplcados. Las paulas iniciales, que sc publi- 
caron en 1966, fueron vagas. Revisioncs 
postcriorcs de dstas, incluyendo las Uniform 
Guidelines on Employee Selection (1978) (Pau¬ 
tas uniformes sobre seleccidn de cmpleados), 
fueron bastante cspccfficas y los tribunalcs las 
han utilizado para ayudar a resolver disputas 
legates sobre las prdcticas de prueba para el 
empleo (vdase la siguiente seccidn). 

En caso de Mynrt contra Motorola cn 
1964 mared la primera participacidn de los tri¬ 
bunalcs en las pruebas para empleo. Las cucstio- 
ncs que surgieron de este caso sobresaliente 
todavfa reverberan. Leon Myart era un afroesta- 
dounidense que solicitd empleo en una de las 
plantas de ensamblado de tclevisores de la cm- 
presa Motorola. A pesar de que tenfa experien- 
cia muy pertinente para el emplco, al sefior 
Myart se le negd un pucsto porque su califica- 
cidn cn una prueba breve de intcligencia cayd 
por debajo de la punluacidn de cortc de la em- 
presa. Myart solicitd una apelacidn a la Comi- 
sidn de Prdclicas Imparciales de Empleo de 
Illinois afirmando que existfa discriminacidn 
racial. El examinador del estado falld cn favor 
del demandantc y determind que la compatUa 
Motorola deberia ofrccerle un empleo al senor 
Myart. Ademds, el examinador dictamind que 
la pmeba en particular no deberfa utilizarsc en 
cl futuro y que cualquicra nueva deberfa "to- 
mar cn cuenta los factorcs ambicntales que con- 
tribuyen a la privacidn cultural". En csencia, cl 
examinador concluyd que las practicas de eva- 
luacidn de empleo de Motorola eran injustas 
porque actuaban como una barrera para el em¬ 
pleo de solicitantes con privacidn y desventa- 


jas culturalcs. Aunquc posteriormente se anuld 
el caso debido a falta de cvidencia, Myart con¬ 
tra Motorola establecid cl prcccdcntc para dar 
audiencia a dichas demandas en el sislema ju¬ 
dicial (Arvey y Faley, 1988). 

ADVENIMIENTO DE LAS NORMAS 
DE EVALUA06N PARA EL EMPLEO 
DE LA EEOC 

Durante cl deccnio de 1970, varios casos judi- 
cialcs ayudaron a moldear las normas y prdcti- 
cas rccicntes cn cuanto a las pruebas para 
empleo. El punto central del caso de Griggs 
contra Duke Power Company (1971) era 
la utilizacidn de pruebas —en este caso la 
Wonderlic Personnel Evaluation y la Bennett 
Mechanical Comprehension Test — como cri- 
terios de elegibilidad para cmpleados que de- 
seaban una transferencia a otros departamentos. 
En particular, los cmpleados de la Duke Power 
Company que carecfan de una cducacidn se¬ 
cundaria podfan estar cn condiciones de lograr 
la transferencia si obtenfan puntuaciones por 
encima de la mediana nacional cn ambas prue¬ 
bas. La polftica pareefa discriminar contra 
cmpleados afroesladounidenses, dado que era 
extremadamente diffcil que alcanzaran la ele¬ 
gibilidad para la transferencia. No obstante, los 
tribunalcs mcnores no encontraron inlencioncs 
discriminatorias y, por tanto, fallaron cn favor 
de la compania cldctrica. 

En 1971, la Suprema Corte revirtid la de¬ 
cision del tribunal menor y dictamind contra 
la utilizacidn de pruebas sin su validacidn. La 
decisidn enfatizd varios puntos de relcvan- 
cia actual (Arvey y Faley, 1988): 

• La equidad en las pruebas para empleo se de- 
termina por las consecuencias, no por las 
motivaciones. 

• Las prdcticas de prueba deben tener un lazo 
dcmostrable con el desempeno en el puesto. 

• El empleador tiene la carga de la prueba para 
demostrar que una prdctica de emplco como 
la cvaluacidn con pruebas tiene relacidn con 
el puesto. 
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• Los diplomas, tftulos o instrumentos amplios 
de examen no son mcdidas adccuadas de la 
capacidad rclacionada con el puesto. 

• Las normas de prueba de la EEOC merccen 
adhesion considerable de parte de quienes 
hacen evaluaciones para empleo. 

Estas pautas para las pruebas de empleo se re- 
finaron todavia mas gracias a una dccisidn ju¬ 
dicial de 1973, EUA contra la Georgia Power 
Company. En este caso, la compafifa eldctrica 
de Georgia presentd un estudio de validacidn 
para sustentar sus prdcticas de prueba para em¬ 
pleo cuando se mostrd que sus polfticas tenian 
un impacto adverso en la contratacidn y trans- 
ferencia de trabajadores afroestadounidcnses. 
No obstante, el estudio de validez era ddbil, en 
parte debido a que se basaba en un andlisis de 
discriminacidn multiple, una tdcnica estadfsli- 
ca compleja que se utiliza en pocas ocasiones 
para este propdsito. Los tribunales dictamina- 
ron que el estudio de validacidn era inadecua- 
do ya que no sc adherfa a las pautas de la EEOC 
en cuanto a la evaluacidn de los estudios de va¬ 
lidez. Esta conclusidn asentd la posicidn de las 
pautas de la EEOC casi como si fuera derecho 
comun en cuanto a las prdcticas de prueba para 
empleo. 

Varios otros casos judicialcs durante los 
decenios de 1970 y 1980 tambidn sirvieron para 
fortalcccr la autoridad de las pautas de prueba 
de la EEOC. Eslos casos son bastante comple- 
jos e implicaron multiples cuestiones ademds 
de aquellas que se citan aquf. En el caso de 
Albemarle contra Moody (1975), la Suprema 
Corte se adhirid a las pautas de la EEOC al 
dictaminar que las calificaciones subjeti vas de 
supervisidn son ambiguas y, por tanto, constitu- 
yen una base deficiente para cvaluar la validez 
de una prueba de seleccidn para empleo. La cues- 
ti6n central en el caso de Washington contra 
Davis (1976) era la duda de si el desempefio en 
un programa de entrenamiento (al contrario del 
desempefio en el trabajo) era una base suficiente 
para determinar la relacidn que pudieran tener 
con el trabajo los procedimientos de seleccidn 
para el empleo. En este caso. la Suprema Corte 
dictamin6 que el desempefio en un programa 


de entrenamiento para oficiales de policfa era 
un critcrio suficiente contra el cual validar una 
prueba de seleccidn. 

En cl caso del Estado de Connecticut con¬ 
tra Teal, la Suprema Corte de EUA se puso cn 
favor de cuatro empleados estatalcs afroesta- 
dounidcnscs que habfan reprobado una prtteba 
escrita que se utilizaba para seleccionar a los 
solicitantes para el puesto de supervisor de cle- 
gibilidad para beneficencia. Los trabajadores 
aftrmaron que existfa discriminacidn injusta, 
scnalando que sdlo 54% de los solicitantes de 
minorfas aprobaban el examen, en comparacidn 
con 80% de las personas de raza blanca. En su 
defensa, el estado de Connecticut afirmd que 
no existfa discriminacidn, dado que 23% de los 
solicitantes afroestadounidenses exitosos final- 
mente recibfan ascensos, en comparacidn con 
14% de los de raza blanca. El tribunal no se 
mostrd impresionado con este argumento y 
senald que cl Tftulo VII del Dccreto de 1964 
sobre derechos civiles se disefid cspcciTica- 
mente para proteger a los individuos y no a los 
grupos. Asf, cualquier falta de equidad hacia 
un individuo es inaccptable. En Arvey y Falcy 
(1988), Cascio (1987), Klei man y Falcy (1985) 
y Russell (1984) puede encontrarsc un mayor 
andlisis de los casos judiciales sobre empleo 
equitativo. 

PAUTAS UNIFORMES PARA LA 
SELECCI6N DE PERSONAL 

Durante el dccenio de 1970, varias instancias 
federales y grupos profesionales propusicron 
revisiones y extensiones para las pautas cxis- 
tentes de la EEOC en cuanto a pruebas para 
empleo. Las revisiones se desarrollaron en res- 
puesta a las decisiones judiciales que habfan 
interpretado las pautas de la EEOC de manera 
estrecha, inflexible y legalista. Sin embargo, la 
existencia de varios conjuntos de pautas com- 
petitivas producta confusidn y se ejercicron 
fuertes presiones sobre las partes implicadas 
para llegar a un acuerdo. Estos esfuerzos cul- 
minaron cn un documento de consenso conoci- 
do como las Pautas Uniformes para la 
Seleccidn de Personal de 1978. 
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Las pautas uniformes pronto obtuvieron res- 
peto en los casos judiciales y con frecuencia se 
les cita en resoluciones dc disputas legalcs. Las 
nuevas pautas contienen interpretation y orien- 
tacion que no se cncuentra en las versiones an- 
teriores, en particular cn cuanto al impacto 
adverso, la cquidad y la validacidn de los pro- 
cesos de seleccidn, como se anaiiza mils ade- 
lante. 

Las Pautas uniformes proporcionan una 
definicidn muy especffica del impacto adver¬ 
so. En general, cuando los procedimicntos de 
seleccidn favorecen a los solicitantes de un gru- 
po (en general varones 0 de raza blanca), se 
dice que la base para la seleccidn tiene un Im¬ 
pacto adverso sobre otros grupos (en general 
mujeres o dc raza no blanca) con una propor¬ 
tion m,1s baja dc sclecci6n. Las pautas unifor¬ 
mes definen el impacto adverso con una regia 
de cuatro quintas partes. En tdrminos espeeffi- 
cos, existe un impacto adverso si un grupo tie¬ 
ne una tasa de selection menor a cuatro quintas 
partes de la del grupo con aqudlla mds elevada 
de selection. Por ejemplo, considdrcse a un 
empleador que tuvo 200 solicitantes cn un ano, 
100 afroestadounidenses y 100 dc raza blanca. 
Si se contratd a 120 personas, incluyendo 80 
de raza blanca y 40 afroestadounidenses, en- 
tonces el porcentaje de personas de raza blanca 
contratada es de 80% (80/100), mientras que el 
de afroestadounidenses contratados es de 40% 
(40/100). Dado que la tasa de selection para 
los afroestadounidenses es dc la mitad de 
aqudlla de los de raza blanca (40%/80%), el 
empleador podrfa estar vulnerable a una acusa- 
ciOn de impacto adverso. Se debe scnalar que 
las pautas uniformes sugieren precaution accr- 
ca dc esta regia cuando los tamartos de la mues- 
tra son pequefios. 

Las pautas uniformes tambidn prestan 
mayor atencidn a la equidad que los documen- 
tos antcriores. £sta sc trata de la siguiente ma- 
ncra: 

Cuando los miembros de un grupo racial, gtnico 
0 sexual obtienen de manera caracterfslica ca- 
lificaciones menores en un procedimlento de 
selectI6n que los de otro grupo y las diferenclas 
no se reflejan en una medida del desemperto en 


el trabajo, la utilizacidn del procedimlento de se- 
leccidn puede negar do manera Injusta oportuni- 
dades a los miembros del grupo que obtiene las 
callficaclones mSs bajas. Lo que es mSs, en ca¬ 
sos donde dos o mds procedlmlentos de selec- 
cion tlenen tgual valldez. el empleador esta obli- 
gado a utilizar el mblodo que produzca el menor 
Impacto adverso. 

Las pautas uniformes tambidn estableccn una 
fuerte responsabilidad de discrimination posi- 
tiva de parte de los empleadores. Si un em¬ 
pleador cncuentra una disparidad sustancial en 
las personas contratadas de un subgrupo en 
comparacidn con su disponibilidad en el mer- 
cado de trabajo, se rccomiendan varios pasos 
correctivos. £stos incluycn programas especia- 
lizados dc rcclutamiento disenados para atraer 
a miembros calificados del grupo en cucstiOn, 
programas de entrenamiento cn cl trabajo de 
modo que las minorfas afectadas no queden atra- 
padas cn cmpleos sin future y una reforma de 
los proccdimientos de seleccidn para reducir 0 
eliminar los efcctos de exclusidn. 

Por ultimo, las pautas proporcionan es- 
tindares tdcnicos especfficos para evaluar los 
estudios de validez dc los procedimientos de 
scleccidn dc personal. Casi con toda seguridad 
los tribunates consultant estas pautas unifor¬ 
mes si los empleados demandan a una compa¬ 
ny debido a la supuesta injusticia en las prdcticas 
dc seleccidn dc personal. Asf, quien no presta 
atencidn especial a estos crilcrios tdcnicos es 
un empleador insensato. Por ejemplo, un criterio 
se relaciona con la utilizacidn de las puntuacio- 
ncs de desempefio obtenidas durante progra¬ 
mas de entrenamiento: 

Cuando so utiliza como criterio el desempofto en 
el entrenamiento, el 6xito en 4ste debe medirse 
de modo apropiado y debe demostrarse la rele- 
vancia del entrenamiento ya sea al comparer el 
contenido del programa de entrenamiento con 
una conducta o conductas laborales importantes 
para el trabajo o trabajos, o al demostrar la rela- 
ci6n entre las medidas de desempofto en entre¬ 
namiento y en el trabajo. 

Asf, la valoracion previa a la contratacidn de 
los candidatos al puesto en un programa de en¬ 
trenamiento puede constituir un mdtodo vdlido 
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de selection dc personal, pero s6!o si existe un 
fucrtc vfnculo entre las demandas dc la tarca 
dentro del cntrenamiento y los requisitos del 
puesto en sf. 

Las pautas uni formes conticncn muchos 
otros criterios que no pueden revisarse aquf. Se 
insta al lector a leer estc fascinantc e influycntc 
documento que a menudo se cita cn casos judi- 
ciales sobre discriminacidn en el trabajo. 

IMPUCACIONES LEGALES 
DE LAS ESTRATEGIAS SUBJET1VAS 
PARA EL EMPLEO 

En muchas corporaciones, los ascensos se ba- 
san cn el juicio subjetivo de los gerentes con 
mayor antigtiedad. Una prdctica cornu n es que 
uno o mas gerentes entrevisten a empleados 
calificados y que ofrezean un asccnso al candi- 
dato que parcce mds prometedor. La seleccidn 
de este candidato sc basa por lo comtin en la 
estimacidn subjetiva de factorcs talcs como jui¬ 
cio, originalidad, ambicidn, lealtad y tacto. 
Hasta hacc poco (iempo, estas estrategias de 
empleo pareefan estar fuera del especlro de las 
prdcticas imparcialcs dc empleo codificadas cn 
las pautas uniformes y otras fuentes. 

No obstante, en un caso civil rccientc, 
Watson contra el Fort Worth Bank and This! 
(1988), la Suprema Corte facilitd a los empleados 
la posibilidad de probar los cargos dc discrimi- 
nacidn racial o sexual contra los empleadores 
que utilizan entrevistas y otros medios subjeti- 
vos de evaluacidn para la seleccidn o promo¬ 
tion dc empleados. Se resumen los antecedentes 
objetivos de estc importante caso antes de ana- 
lizar las implicaciones legalcs (BersofT, 1988). 

Clara Watson, una empleada afroestado- 
unidense del Fori Worth Bank and Trust, fue 
rechazada para un asccnso al puesto dc super¬ 
visor cuatro veces seguidas. En cada ocasidn, 
un solicitante de raza blanca rccibid el ascen- 
so. Watson obtuvo cvidencia que demostraba 
que el banco nunca habfa tenido un funciona- 
rio o director afroestadounidense, sdlo habian 
tenido un supervisor dc esa raza y le pagaba 
salarios mis bajos a los empleados afroestado- 


unidenses que a los dc raza blanca equivalcn- 
tes. Adcmds, todos los supervisores teni'an qu e 
recibir aprobacidn dc un viccpresidcntc dc raza 
blanca, vardn, antes de que sc les promoviera. 
El banco no debatid el hccho de que tomara las 
dccisioncs de contratacidn y promocidn sdlo 
con base en el juicio subjetivo. Cuando un and- 
lisis de los patrones de promocidn confirmd 
disparidadcs raciales estadfsticamentc signifi- 
cativas, Watson demandd al banco. 

Watson tuvo a la mano dos teorias legalcs 
para litigar su demanda bajo el Tftulo VII del 
Decrclo de 1964 sobre derechos civilcs. Las dos 
teorfas se denominan “tratamiento desigual” e 
“impacto desigual". Un caso de tratamiento 
desigual es mds diffcil de litigar, dado que cl 
demandante debe probar que cl emplcador par- 
ticipd en una discriminacidn intcncional. En un 
caso de impacto desigual, la intcncidn es irre- 
levante. En vcz de ello, el demandante sdlo 
necesita dcmoslrar que una prdctica particular 
dc empleo —como la utilizacidn dc una prueba 
estandarizada— rcsulta cn un impacto que es 
adverso de mancra inneccsaria y desproporcio- 
nada sobre una minorfa protegida. 

Los tribunates mcnorcs diclaminaron que 
Watson tenfa que restringirse al planteamiento 
mas limitado del tratamiento desigual, dado que 
el emplcador habfa utilizado procedimientos 
subjetivos dc valoracidn. Adcmds, estos tribu¬ 
nates diclaminaron que el banco no habfa par- 
ticipado en una discriminacidn intcncional y 
tenfa razones legftimas para no promover a 
Watson. No obstante, la Suprema Corte estuvo 
de acuerdo en atender el caso a fin dc determi- 
nar si podia aplicarse un andlisis dc impacto 
desigual a las estrategias subjetivas dc empleo, 
como la entrevista. Basada cn gran medida cn 
un informe de la American Psychological 
Association (APA, 1988), la Suprema Corte 
dictamind dc mancra undnime que el andlisis 
de impacto desigual puede aplicarse a las prdc- 
ticas subjetivas o discrecionales de promocidn 
que sc basan en entrevistas. En efecto, el tribunal 
determind que pueden validarse las estrategias 
subjetivas de empleo como la entrevista. Por 
tanto, los empleadores no tienen la posibilidad 
dc discrecionalidad sin vigilancia para cvaluar 
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a los solicitantes de un ascenso con base en 
una entrcvista subjetiva. Como consecuencia 
del caso de Watson contra el Fort Worth 
Bank and Trust, los emplcadorcs deben eslar 
listos para defender todas sus practicas de pro¬ 
motion —incluyendo la entrevista subjetiva— 
contra demandas por impacto adverso. 

AVANCES RECIENTES EN LA SELECCI6N 
DE PERSONAL 

En 1990, cl Congrcso de EUA aprobd el De- 
creto sobre los estadounidenscs con discapaci- 
dades (ADA), que prohfbc la discriminacidn 
contra individuos calificados que tengan una 
discapacidad. El ADA se analizd de mancra 
breve en cl tema 7A, Examen de poblaciones 
espcciales. Estc dccrcto protege a los solicitan¬ 
tes de empleo que tienen discapacidadcs al li- 
mitar de manera estricta las razones permisiblcs 
para negarse a contratarlos. En tdrminos espe- 
cfficos, los empleadores pueden negarse a con- 
tratar a un trabajador con discapacidad solo por 
las siguientes razones: 1) si su contratacidn 
puede causar dificultades injustificadas a la 
companfa en cuanto a tener que realizar adap- 
tacioncs para la discapacidad; 2) por necesida- 
des comcrciales o 3) si la prescncia del 
trabajador con discapacidad puede representar 
una amenaza dirccta a la salud o seguridad del 
trabajador o de los demds. 

Una estipulacidn importantc del ADA cs 
que no pueden aplicarse pruebas medicas an¬ 
tes de ofrccer un empleo. Por dcsgracia, el de- 
creto no define de mancra adccuada que es lo 
que constituye una “prueba mddica". En parti¬ 
cular, es posible que se interprete que las prue¬ 
bas de intcligcncia tienen una naturaleza 
“mddica”, lo cual podria dcvaslar el campo de 
las pruebas para empleo: 

Segtin los requisites del ADA, si un atributo no 
se requiere para el desempeAo de una tarea esen- 
cial, entonces un solicitante puede pedir una 
adaptacibn o nx>dificaci6n ya sea dol proceso de 
prueba o del empleo si aflrma tener una disca¬ 
pacidad proteglda que se asocie con ese atri¬ 
buto no esencial. En la prbctica, esto podria 
signlficar que, a menos que se demuestre que la 


Evaluation industrial y organizational • 523 


inteligencia es un requisite para el logro de una 
tarea esencial, nlnguna prueba que mlda inteli¬ 
gencia (o cualquier laceta de bsta) puede 
aplicarse antes de olrecer empleo a cualquier 
solicitante que exprese una alteracidn asociada 
con el funcionamiento intelectual (Landy, 
Shartkster y Kohler, 1994). 

Aun es demasiado pronto como para determi- 
nar el impacto del ADA sobre la prdctica de la 
seleccidn de personal. Existe confusion acerca 
de cutiles discapacidadcs cubre cl dccrcto, in- 
ccrtidumbrc acerca de curies practicas de eva¬ 
luation estan prohibidas, y ansiedad acerca de 
cudnlas personas buscaran una adaplacidn con 
fundamento en cl decreto (Klimoski y Palmer, 
1994). Sc rcqucririi de decisiones judiciales y 
pautas administrativas para afinar los detalles 
de esta importantc lcgislacidn. 

El Decreto de 1991 sobre Derechos Civi- 
les tambien contiene importantes disposicioncs 
rclacionadas con la seleccidn y estimacidn de 
personal. En tbrminos especfficos, la ley prohf¬ 
bc normas de subgrupo para las califtcacioncs 
de una prueba, locual efectivamenteelimina la 
utilizacidn de listas separadas de contratacidn 
y promocidn. Las normas de subgrupo se re- 
fieren a la prdctica de utilizar subgrupos iden- 
tificados (cn vcz de una mucstra nacional 
diversificada) con el propdsito de dcsarroliar 
normas dc prueba especfficas de grupo. La pro- 
hibicidn de esta prdctica reprcsenta un reto para 
los empleadores y psicdlogos I/O, ya que las 
normas de subgrupo racial para las calificacio- 
nes dc una prueba han sido un mdtodo popular 
y cficaz para evitar el impacto adverso. 

Los casos judiciales rccicntes tambien han 
tenido repercusiones en las pruebas para el per¬ 
sonal. La cuestidn en el caso de Soraka con¬ 
tra Dayton Hudson fuc si las corporaciones 
pueden utilizar una prueba de personalidad 
como base para la investigacidn previa a la con¬ 
tratacidn en busqueda de problemas de salud 
mental en los solicitantes de empleo. Como se 
analizd antes, se pidid a Soraka que rcalizara la 
prueba Rodgers Psychscreen (Psicodeteccidn 
Rodgers) como parte del proceso de solicitud 
del puesto de guardia de seguridad. La Psicodc- 
tcccidn cs un inventario de personalidad de falso- 
verdadero que tiene el propdsito de identificar 




524 • Evaluation pslcologica: Hlstoria, printiplos y aplicaclones 


(Capitulo ii) 


a personas con problemas psicol6gicos como 
dcpresidn y ansiedad. Soraka demandd a la tien- 
da departamental, afirmando que las preguntas 
individuales acerca de sus practicas sexuales y 
creencias religiosas violaban sus dcrechos ci- 
viles. Este caso fue interesante porque tuvo que 
vcr con el valor y validez de los reactivos indi¬ 
viduales en contraposicidn a las calificaciones 
totales de la prucba. Los tribunales han soste- 
nido durante largo tiempo que las pruebas pre- 


vias al empleo deben tener una relevancia de- 
mostrada para el desempeno en el puesto o no 
se les puede utilizar. No obstante, los tribuna- 
les no han requerido evidcncia de validez para 
los reactivos individuates de prueba. Soraka 
gand este caso, que Daytona Hudson apcld. En 
1993, la companfa llegd a un arrcglo fuera dc 
la corte. Este litigio se resume en cl ejemplo 
de caso 11-2 que se presenta antes en esta sec- 
cidn. 


rCj RESUMEN 


1. La estimacidn del desempeno de los em- 
pleados es esencial para el dxito continuo 
dc cualquicr ncgocio u organizacidn. La me- 
dicidn psicoldgica aplicada se coloca al cen¬ 
tra de dicha estimacidn. 

2. La valoracidn del desempeno satisface mu- 
chos propdsitos de las organizaciones, in- 
cluyendo ascensos, transfcrencias, despidos 
y establecimicnto de salarios. Aunquc puc- 
den parecer preferibles los mdtodos obje- 
tivos para la evaluacidn de la efectividad 
de los emplcados, a menudo los enfoques de 
juicio son la unica opcidn prdctica. 

3. Los mdtodos para la estimacidn del desem¬ 
peno incluyen medidas como los cdlculos 
de productividad; datos sobre el personal 
como la tasa dc ausentismo; calificaciones 
de compancros y autoevaluacioncs; y valo- 
raciones del supervisor como las escalas de 
calificacidn. £stas son, con mucho, el md- 
todo mds comun. 

4. Cerca dc tres cuartas partes dc todas las 
valoraciones del desempefio se basan en 
mdtodos de juicio como las escalas de cali¬ 
ficacidn del supervisor. La eseala mds sen- 
cilla es la eseala de calificacidn gr&fica, que 
consiste de etiquetas de rasgos, definicio- 
nes breves dc dichas etiquetas y de un con¬ 
tinuo para la calificacidn. 

5. La eseala dc clasificacidn con base conduc- 
tual (ECBC) es una forma popular de me- 


dida del desempeno rcferida al criterio. Una 
forma de ECBC conticne referencias 
conductuales explfcitas a lo largo de un con¬ 
tinuo de excelencia, que el supervisor eva- 
lua en tdrminos de observaciones pasadas 
sobre el dcsempefio en cl puesto. 

6. La estimacidn del desempeno estd sujeta a 
diversas fuentes de error que incluyen el 
fracaso para identificar los criterios apro- 
piados para el desempefio aceptable c in* 
aceptable; el efecto de halo (dar califica¬ 
ciones altas o bajas a un empleado en todas 
las dimensioncs debido a una impresidn 
global), el sesgo del calificador y la conta- 
minacidn del criterio. 

7. La contaminacidn del criterio ocurre cuan- 
do una medida de criterio incluye factores 
que no son parte demostrable del trabajo, 
como calificar a un empleado en cuanto a 
“trato con el publico" cuando csto no es en 
realidad parte del puesto. 

8. Pautas apropiadas para el desarrollo de sis- 
temas de estimacidn del desempefio inclu¬ 
yen basar el mdtodo de estimaci6n en un 
andlisis cuidadoso del puesto; entrenar a los 
calificadores para que sean imparciales, 
precisos y legates; y evaluar de manera pe- 
riddica el sistema dc estimacidn del desem¬ 
peno. 

9. Las pruebas y estimacidn de los emplcados 
se encuentran cuidadosamente limitadas por 
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pautas legates y rcguladoras. Por ejemplo, 
el TIlulo VII del Decrcto dc 1964 sobre 
derechos civiles prohfbe las prdclicas de 
contratacidn que discriminen con base en 
la raza, color, religidn, sexo u origen na- 
cional. 

10. Varios casos judiciales han ayudado a mol- 
dcar las pr&cticas de prueba en la seleccidn 
de personal. Por ejemplo, en el caso de 
Griggs contra la Duke Power (1971), la 
Suprcma Corte dictamind que la imparcia- 
lidad dc las pruebas para empleo se deter- 
rnina por las consecuencias, no por las 
motivaciones; las prfcticas de prueba dc- 
ben tener un vinculo demostrable con cl 
desempeiio en cl pucsto; y el empleador de- 
be demostrar que las prdcticas de prueba se 
relacionan con el mismo. 

11. Varias instancias federates y grupos profe- 
sionales ayudaron a dcsarrollar las Uniform 
Guidelines on Employee Selection (Pautas 
uniformes para la seleccidn de empleados; 
1978). Estc documento proporciona oricn- 
tacidn acerca de muchas prdcticas de eva- 
luacidn de empleados, incluyendo una 


H TERMINOS Y CONCEPTOS CLAVE 


Problcma del critcrio 

p. 508 

Escala de calificacidn grdfica 

p. 510 

Lista de verificacidn de incidcntes 

crfticos 

p. 510 

Escala de clasificacidn con base 

conductual 

p. 512 


definicidn muy especlfica del impacto ad- 
verso. 

12. En general, cuando los procedimicntos de 
scleccidn favoreccn a los solicitantes de un 
grupo (en general varoncs o de raza blan- 
ca), se dice que ia base para la seleccidn 
lienc un impacto adverso sobre otros gru¬ 
pos (en general mujeres o de raza no blan- 
ca) cuando ticncn una proporcidn mas baja 
de seleccidn (menos de cuatro quintas par¬ 
tes del grupo de mayorla). 

13. Como consecucncia del caso de Watson 
contra el Fort Worth Bank and Trust 
(1988), en la actualidad los empleadorcs 
deben cstar en posicidn dc defender todas 
sus prdcticas dc promocidn —incluyendo 
la entrevista subjetiva—contra las deman- 
das por impacto adverso. 

14. El Decretode 1991 sobre los cstadouniden- 
ses con discapacidadcs tambten contiene 
importantes disposiciones rclacionadas con 
la seleccibn y estimacidn de los empleados. 
Por ejemplo, el Decrcto sobre derechos ci¬ 
viles prohfbe las normas de subgrupo para 
las pruebas. 


Escala de Observaci6n Conductual p. 512 


Escala de elecci6n forzosa p. 512 

EfectodeHalo p. 514 

Scsgo del calificador p. 515 

Contaminacidn del criterio p. 515 

Impacto adverso p. 521 
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Evaluacion de intereses y valores 
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Perspectiva general de la evaluacibn de intereses 
Inventarios para la evaluacibn de intereses 
Evaluacibn de carrera y de valores de trabajo 
Modelo integrador de la evaluacibn de carrera 
Resumen 

Tbrminos y conceptos clave 


En estc capftulo se analizan los en toques 
para la cvaluacibn dc intereses y valores, defi- 
nidos de manera amplia. Debido a su valor for- 
mativo en lodos los aspectos desde cl trabajo 
hasta la dcvocibn, los intereses y valores son 
fundamentales para la identidad de cada indi- 
viduo. No cs accidental que el adolcscente que 
valora la armom'a estetica revele postcriormen- 
tc un interds en la literatura y despues siga una 
vocacibn como maestro de Espartol. Tampoco 


es sorpresa que un adolescente tfmido que tiene 
una tendcncia analftica, muestre pasibn por las 
matembticas y se convierta en un cient/fico 
inform/itico. Los valores que tienen las personas 
moldean sus intereses en la vida, los cuales, a 
su vex, moldean la cleccibn de carrera. La vida 
posee una congruencia que se explica, en par¬ 
te, por la influcncia de los intereses y valores. 

Los valores no sblo vinculan al individuo 
con cl mundo laboral, se encuentran entrelaza- 
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dos tambidn con las cuestiones morales, espi- 
rituales y religiosas. El que sc favorezca o se 
estd en contra de la pena capital, que se consi- 
derc que la vida tiene significado o es mera- 
mente caotica, que se busque o se evite la 
prdctica rcligiosa —estas cuestiones se deciden 
con base en los valorcs pcrsonales. En suma, 
las elccciones que sc toman con respecto al tra- 
bajo, vida cspiritual y conducta personal no son 
aleatorias, se ligan por los lazos que se dcno- 
minan intereses y valores. 

Un problema que cnfrenlan muchos jdvencs 
adultos es que no se han formulado sus valores 
ni se han explorado sus intereses. Lo que es m4s, 
carecen del conocimicnto accrca de las opciones 
de carrera. En estos casos, la seleccidn de carre- 
ra puede despertar ansiedad y quiziS deberfa 
haccrlo. Lowman (1991) ha senalado que cl pro- 
ceso para encontrar una vocacidn puede ser tan 
complejo y diffcil como elegir una pareja. El 
dilema de la eleccidn de carrera no se limila a los 
jdvenes adultos que ingresan al mercado labo- 
ral, sino que tambidn inquieta a los trabajadores 
de mayor edad que se encuentran insatisfechos 
con sus profesioncs. Por fortuna, cxiste gran 
cantidad de pruebas y de enfoques de orienta- 
ci6n para ayudar a los individuos a identificar 
sus valores, intereses y elccciones potenciales 
de carrera, como se analiza en estc tema. 

En el Tema 12A, Evaluacidn de intereses y 
de valores de trabajo, se estudia la medicidn de 
aqudllos relacionados con el trabajo. El ccntro 
de atcncidn en este caso se coloca en el mundo 
laboral y en la utilizacidn de pruebas especiali- 
zadas para la evaluation y orientaciOn de ca¬ 
rrera. En el Tema 12B, Valores en cl desarrollo 
moral, espiritual y religioso, se presentan al lec¬ 
tor los mdtodos e inquietudes en la evaluation 
de las dimensiones moral, espiritual y religio- 
sa del individuo. 


PERSPECTIVE GENERAL DE LA 
evaluaci6n DE INTERESES 


En la mayor parte de las aplicaciones de prue¬ 
bas psico!6gicas, los objetivos de la evaluation 
son razonablemente claros. Por ejemplo, las 



pruebas de inteligencia ayudan a predecir cl 
desempefio escolar; las de aptitud predicen 
el potencial de logro; y las de pcrsonalidad pro. 
porcionan information acerca del funcionn. 
miento social y emocional. Pero, ^cuSl es cl 
propOsito de la evaluation de intereses? ^p 0r 
qud la rccomendarfa un psicOlogo? ^Qud benc- 
ficio puede esperar un cliente de un estudio de 
este lipo? 

La evaluation de intereses promueve dos 
metas compatibles: la satisfaction vital y la pro 
ductividad vocacional. Es casi evidente en sf 
mismo que una buena concordancia entre los 
intereses individuates y la vocation elegida 
ayudara a fomentar la satisfaction personal con 
la vida. Despuds de todo, cuando el trabajo cs 
interesante es mds probable que se experimen- 
te tambidn satisfaction personal. Adem4s, las 
personas satisfechas con su trabajo estdn en 
mayor probabilidad de ser productivas. Por tan- 
to, empleados y emplcadores por igual obtic- 
nen bcneficios de la aplicacidn ingeniosa de la 
evaluacidn de intereses. Existen varios instru¬ 
ments utiles para este propdsito y posteriormen- 
te se revisardn los inventarios de intereses de 
uso mds amplio. 

En la seleccidn de empleados, la conside- 
racidn de los intereses personales puede tener 
gran importancia prdctica para los emplcadores 
y, por tanto, tambidn es apropiada de mancra 
contingente para los candidatos a) puesto. Pue¬ 
de plantearse una ecuaci6n aproximada como 
sigue: productividad = capacidad x intereses. 
En otras palabras, la capacidad elevada en un 
campo cspccffico no garantiza cl dxito, como 
tampoco lo hace el nivel alto de interds. Es po- 
sible tener los mejores medios de prcdiccidn 
cuando se consideran ambas variables. Asf, los 
emplcadores tienen una buena razdn para de- 
terminar si un empleado potencial sc adecua 
bien al puesto; el empleado tambidn deberfa 
tener el dcsco de saber. 

Se comienza esta seccidn con un examen 
crftico de las principales pruebas dc intereses. 
Los scis instruments elegidos para revisidn 
incluyen los siguientes: 

• El Strong Interest Inventory, SII (Inventario 
Strong de Intereses); la ultima revision del 
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Lniuy conocido Strong Vocational Interest 
Blank, SVIB (Formulario Strong de Intcrc- 
jeS Vocacionales). 

• El Jackson Vocational Interest Survey, JVIS 
(Encuesta Jackson dc Intereses Vocacionales), 
lina prucba que incorpora los mctodos mo- 
(Jcrnos de construcci6n de cscala. 


• El Kuder General Interest Survey, KGIS (Es- 
tudio de intereses generales de Kuder), un 
jnstrumento que incorpora una filosoffa di- 
vergente de construccidn dc pruebas. 


«El Vocational Preference Inventory, VPI (Inven- 
lariode prcferencia vocacional),quc midcscis 
tcmas vocacionales ampliamcntc utilizados. 

• La Self-Directed Search, SDS (Busqueda in- 
depcndicnte), una gufa autoaplicable y auto- 
calificable para cxplorar opcioncs dc carrera. 

• El Campbell Interest and Skill Survey, CISS 
(Encuesta Campbell dc intereses y habili- 
dadcs), una prucba recicntc y atractiva que 
tiene un formato sencillo, pero es compleja 
en cjecucidn. 


Despuds de la revisidn de las pruebas destaca- 
dasdc intereses sigue el tema relacionado dc la 
cvaluacidn de valores asociados con la profc- 
ston y el trabajo. 

■ iNVENTARIOS 
fti PARA LA EVALUAClbN 
):j DE INTERESES 

INVENTARIO STRONG DE INTERESES 


El Strong Interest Inventory-, SII (Invcntario 
Strong de Intereses) es la ultima revisidn del 
Strong Vocational Interest Blank (SVIB), uno 
de los instrumentos mas antiguos y destacados 
en las evaluation psicoldgica (Hansen. 1992). 
Es posible comprender mejor al SII a travds del 
estudio de la historia de su respetado prede- 
cesor, el SVIB. En particular, es neccsario rc- 
visar las suposiciones que sirvieron de gufa para 
la construction del SVIB y que se han seguido 
hasta el SII. 


La primera edition del SVIB aparccid en 
1927, ocho aiios despuds dc que E. K. Strong 
formulara los proccdimientos esenciales para 
medir los intereses ocupacionales mientras asis- 
t(a a un seminario en el Carnegie Institute of 
Technology (Campbell, 1971; Strong, 1927). 
Para la construccidn del SVIB, Strong emplcd 
dos tdcnicas poco utilizadas en la mcdicidn. 
Primcro, se pedfa al examinando que expresa- 
ra su agrado o desagrado hacia una muestra 
grande y variada de ocupaciones, disciplinas 
educativas, tipos de personalidad y actividades 
recrealivas. En segundo lugar, se codiftcaron 
empiricamente las respucstas para las ocupa¬ 
ciones especificas. En una codificacidn de este 
tipo, una respuesta especffica (p. ej., agrado 
hacia el patinaje de ruedas) se asigna a la csca¬ 
la para una ocupaci6n particular, sdlo si las per¬ 
sonas cxitosas cn esa ocupacidn tienden a 
responder dc esc modo con mayor frecuencia 
que las personas de comparacidn. 

Aunque Strong no exprcsd sus suposicio¬ 
nes subyaccntcs dc manera simple y directa, es 
claro que la fundamentacidn tedrica para el 
SVIB se deriva de una concepcidn lipoldgica, 
orientada a los rasgos, acerca de la personali¬ 
dad. Tzeng (1987) ha idcntificado las siguientes 
suposiciones bdsicas en cl desarrollo y aplica- 
cidn del SVIB: 

1. Cada ocupacidn tiene un patrdn deseablc dc 
intereses y caracterfsticas de personalidad 
entre sus trabajadores. El patrdn ideal se re- 
presenta a travds de las personas exitosas en 
esa ocupacidn. 

2. Cada individuo tiene intereses y rasgas de 
personalidad relativamcntc cstables. Cuan- 
do dichas intereses y rasgos se adecuan a los 
patrones deseables de intereses dc la ocupa¬ 
cidn, el individuo tiene una probabilidad ele- 
vada dc entrar a esa ocupacidn y es m£s 
factible que lenga cxito en ella. 

3. Es posible diferenciar a los individuos en una 
ocupacidn dada dc las olras personas en ge¬ 
neral, en tdrminos de los patrones deseables 
de intereses y rasgos para esa ocupacidn. 

Strong constniyd las escalas dc su inventario al 
contrastar las respuestas de varios grupos cri- 
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terio de ocupacioncs especfficas con aqudllas 
de un grupo de personas en general. Los indivi- 
duos de cada grupo critcrio eran trabajadores 
en esa ocupacidn que se sentfan satisfechos con 
sus uabajos y que habfan (enido tales emplcos 
durante, cuando menos, tres ados. Los reactivos 
que diferenciaban a los dos grupos, codifica- 
dos en la direccidn apropiada, sc scleccionaron 
para cada escala ocupacional. Por cjemplo, si 
los miembros de un grupo ocupacional espeef- 
fico sentfan desagrado hacia “comprar niercan- 
cfas para una tienda" con mayor frecuencia que 
las personas en general, cntonces esc rcactivo 
(codificado en la dircccidn de desagrado) se 
aiiadfa a la escala para esa ocupacidn. 

El primer SVIB consistid de 420 reactivos 
y de sdlo un punado de escalas ocupacionales 
(Strong, 1927). Poco despuds aparccieron edi- 
cioncs separadas para varones y mujeres. El 
inventario ha atravesado por numerosas revi- 
siones a travds de los ados (Tzeng, 1987), las 
cualcs culminaron en el modemo instrumento 
conocido como Strong Interest Inventory (In¬ 
ventario Strong de intcreses); (Campbell, 1974; 
Hansen, 1992; Hansen y Campbell, 1985). 

Aunque el Strong Interest Inventory (SII) 
se disend de acuerdo con la misma filosoffa del 
SVIB, la ultima revisidn se aleja de sus prede- 
cesores en tres sentidos crucialcs: 

1. El SII combina las formas para varones y 
mujeres en una sola cdicidn. 

2. El SII introduce un esquema tedrico para 
guiar la organizacidn e interpretacidn de las 
calificaciones, como se analiza mis adelantc. 

3. El SII incorpora un aumento sustancial en el 
niimero de escalas ocupacionales, en parti¬ 
cular en las leas vocacionalcs/tdcnicas que 
tenfan una baja reprcsentacidn en el SVIB. 

El SII consiste de 317 reactivos agrupados en 
siete secciones. En las primeras cinco, cl exa- 
minando registra el “Agrado", “Indifercncia” 
o “Desagrado" por las ocupaciones, materias 
escolares, actividades, actividades de ocio y 
contacto con diferentes tipos de personas (cua- 
dro 12-1). Una sexta parte requiere que la per¬ 
sona evaluada exprese una preferencia entre 


Cuadro 12-1. Reactivos caracterfsticos 
del Inventario Strong de Intereses 


Marque Agrado, Indiferencia o Desagrado al lado 
de los siguientes incisos: 

1. Manejar un camidn _ 

2. Ser funcionario de caza y pesca __ 

3. Qulmlca _ 

4. Realizar Investigacidn apllcada _ 

5. Actuar en un drama _ 

6. Revistas sobre rmisica __ 

7. Sociologfa _ 

8. Obtencidn de fondos para 

caridades _ 

9. Compra de bienes para una 

tienda _ 

10. Personas que son Ifderes _ 

11. Horario regular de trabajo _ 

12. Personas asertivas _ 


reactivos apareados (p. ej., trato con objetos 
contra trato con personas). La sdptima seccidn 
consiste de afirmaciones autodcscriptivas que 
el examinando marca con “Sf\ “No", “o”? 

El SII puedc calificarse sdlo por medio de 
hojas de respuesta o protocolos prepagados que 
se cnvfan por correo o fax a la editorial o a tra¬ 
vds de la compra de un sistema de software que 
proporciona una calificacidn en cl mismo sitio 
para rcsultados inmediatos. fistos consisten de 
un impreso extenso que se organiza segun di- 
versos temas. Todas las puntuaciones se expre- 
san como puntuaciones estdndar con media dc 
50 y DE de 10. Los resultados normativos para 
varones y mujeres se informan por separado, 
pero se pueden lograr comparaciones entre 
sexos mediante una simple transposicidn visual. 

A nivel mis global existen scis calificaciones 
de tema ocupacional general; a saber, Rcalista, 
Investigador, Artfstico, Social, Emprcndcdory 
Convencional. festas se basaron en cl anlisis 
teorico de Holland (1966, 1985ab), cuyo traba¬ 
jo se analiza despuds. Cada calificacidn de tema 
se asocia con un lea de interds principal que 
describe tanto un ambiente de trabajo como un 
tipo de persona. Por ejemplo, las personas eon 
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calificaciones alias en el tema Realista son, en 
general, bastanlc robustas, tienen dificultad para 
expresar sus sentimientos y prefieren trabajar 
en extcriores con maquinaria pesada. Denlro 
de las calificaciones de tema pueden encontrarse 
25 Escalas de intereses basicos como Aventu¬ 
ra, Matembticas y Ciencias Sociales. Las csca- 
las de interbs se derivaron empiricamentc y 
consisten de reactivos con intcrcorrelacioncs 
sustanciales. 

Los resultados mbs cspecfficos consisten 
de 211 calificaciones para las Escalas Ocupa- 
cionales. En la revision de 1985 del SII, bstas 
se construyeron de manera habitual al compa- 
rar las respuestas de personas cmplcadas en la 
ocupacibn dada contra mucstras de varoncs y 
de mujercs en general (Hansen, 1992; Hansen 
y Campbell, 1985). Las magnitudes de muestra 
para los grupos criterio fucron de 60 a 420 per¬ 
sonas. con 200 o mbs personas en la mayor 
parte de los grupos. Los grupos criterio consis- 
tieron de personas entre los 25 y 60 afios de 
edad, satisfcchos con su ocupacibn, que llena- 
ban ciertas normas mfnimas de empleo exitoso 
y que habian trabajado en la ocupacibn espeef- 
fica durante, al menos, tres afios. La estan- 
darizacibn de la versibn de 1985 implied cl 
examen de mds de 140 000 personas, de quie- 
nes sblo 50 000 satisficieron los critcrios para 
el desarrollo de escala. 

Una innovacibn recicnte del SII es la adi- 
cibn de las escalas de estilo personal (Harmon, 
Hansen, Borgen y Hammer, 1994). £stas se di- 
sefinron para medir las preferencias por estilos 
amplios de vida y trabajo. Estas escalas sirven 
como auxiliares en la orientacibn vocacional al 
mostrar el nivel de comodidad con estilos dis- 
tintivos. Las cuatro escalas de estilo son: 

1. Estilo de trabajo, en el que una calificacibn 
alta indica prefercncia por el trabajo con 
personas y una baja significa un interbs en 
ideas, datos y cosas; 

-• Anibientc de aprendizajc, en el que una alta 
calificacibn indica prefercncia por ambien- 
tes acadbmicos de aprendizaje y una baja 
significa inclinacibn poractividadcs mbs apli- 
cadas de aprendizaje; 


3. Estilo de liderazgo, en el que una califica- 
cibn alta indica comodidad para asumir la 
direccibn sobre otras personas y una baja 
senala intranquilidad; y 

4. Ricsgo/Aventura, en la que una calificacibn 
alta indica preferencia por aciividades arries- 
gadas y audaces mds que por actividadcs 
seguras y fdcilcs de predecir. 

Las escalas de estilo personal tienen una media 
de 50 y DE de 10. Obsbrvese que bstas son 
escalas realmente bipolarcs donde cada polo cs 
especffico y significativo. 

VALORACION Da SII 

El SII representa la culminacibn de mds de 50 
afios de estudio que implican literalmcnte mi¬ 
les de informes de investigacibn y cicntos de 
miles de personas evaluadas. En la valoracibn 
de este instrumento, sdlo pueden esquemati- 
zarsc las tcndcncias bdsicas en la investigacibn 
y referir al lector a otras fuentes para informa- 
cibn detallada (Tzcng, 1987; Campbell, 1971; 
Campbell y Hansen. 1981; Hansen, 1984,1987, 
1992; Hansen y Campbell, 1985). Tambidn se 
debe senalar que las valoraciones de la confiabi- 
lidad y validez del SII sc basan en parte en su 
semejanza con el S VIB, para el cual existe una 
enorme cantidad de datos (bcnicos. 

Con base en cstudios test-retest , la confiabi- 
lidad del SI1-SVIB ha resullado ser excepcio- 
nalmente buena a corto plazo, con coeficientes 
de estabilidad a una y dos semanas para las es¬ 
calas ocupacionales que en uSrminos generales 
se colocan en el rango del .90. Cuando el inter- 
valo test-retesl es de anos o dcccnios, las co- 
rrelaciones descicndcn hasta los rangos de .60 
y .70 para las escalas ocupacionales, excepto 
en el caso de personas que eran mayorcs (de 25 
anos o mas) en la primera prueba. Para perso¬ 
nas mbs jbvenes examinadas en la adolcsccn- 
cia, la correlacibn mediana test-retest despubs 
de 15 anos es de alredcdor de .50 (Lubinski, 
Benbow y Ryan, 1995). Pero para los indivi- 
duos de mayor edad, examinados por primera 
vez despubs de los 25 afios de edad, la correla- 
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ci6n mcdiana test-retest 10 a 20 anos despuds 
cs un fenomenal .80 (Campbell, 1971). Enapa- 
riencia, para el memento que se pasa la adultcz 
joven, los intereses personalcs se vuelven su- 
mamentc establcs. Las preguntas del S1I-SVIB 
capturan esa estabilidad en las puntuaciones 
ocupacionales, lo cual proporciona sustentacidn 
al concepto de rasgos dc personalidad sobre los 
cuales se basaron estos instrumentos. 

La validez del SII-SVIB sc funda en gran 
medida en la capacidad del perfil ocupacional 
inicial para predecir la ocupacidn que en un 
momento dado se practical. Strong (1955) in- 
formd que las probabilidadcs cran de cerca dc 
dos tercios de que las personas trabajanan en 
ocupaciones pronosticadas por calificaciones 
elevadas en las escalas ocupacionales, y de cer¬ 
ca de una de cada cinco de que los individuos 
examinados estarfan en ocupaciones hacia las 
que hubicran moslrado poco interds cuando se 
les sometid a prueba. Aunque otros investiga- 
dorcs evilan dar proporcioncs exactas (Dollivcr, 
Irvin y Bigley, 1972), es claro que cl SII-SVIB 
tiene tasas impresionantes dc acicrto en la pre- 
diccidn de la ocupacidn elegida. El inslrumen- 
to funciona incluso mejor en la prediccidn de 
las ocupaciones a las que una persona evalua- 
da no entrard. En un estudio recicntc, Donnay 
y Borgen (1996) proporcionan evidencia para 
la validez de constructo al demostrar fuerte di- 
fcrcnciacidn general entre 50 grupos ocupacio¬ 
nales en el SII: 

La Irnagen general es que las personas en dileren- 
tes ocupaciones muestran diferencias notables 
y laclibles de predecir en cuanto a agrados y de- 
sagrados, ya sea en tdrmlnos de intereses voca- 
cionales o de estilos personates. Y el Inventario 
Strong proporciona medidas v^lidas, estructura- 
les y amptias acerca de estas diferencias (p. 290) 

El SII se utiliza principalmentc con estudiantes 
de preparatoria y universidad y con adultos que 
buscan orientacidn o conscjo vocational para 
continuar con su educacidn. Debido a que los 
intereses de los estudiantes no estan desarro- 
Uados y son inestablcs antes de los 13 o 14 anos 
dc edad, no se recomienda utilizar el SII antes 
del nivel de educacidn media superior. Como 
es evidente a partir de los datos dc confiabilidad 


que se presentan antes, el SII se vuclve cada vez 
mAs valioso con personas mayores y no es poco 
comun observar a aquiSllas de mcdiana edad 
que ulilizan los resultados de estc instrument 
como orientacidn para el cambio de carrera. 

ENCUESTA JACKSON DE INTERES 
VOCACIONAL 

El Jackson Vocational Interest Survey, JVIS 
(Encuesta Jackson dc Interds Vocacional), es 
un instrumento relativamente nuevo que con- 
trasta agudamentc en varios sentidos con el SII 
(Jackson, 1977; Verhoeve, 1993). Las 34csca- 
las bdsicas dc interds en el JVIS se componen 
dc dos tipos diferentes, escalas dc rol de trabajo 
y escalas de estilo dc trabajo. Las 26 escalas dc 
rol de trabajo miden intereses cspccfficos relacio- 
nados con temas ocupacionales amplios como 
matemdticas, ciencias vitales, aventura, comcr- 
cio y ensenanza. Las ocho escalas de estilo de 
trabajo se disenaron para medir prcferencias por 
el trabajo en ambientes que requicren modos 
particulars de conducta, como seguridad la- 
boral, liderazgo dominante, responsabilidad y 
vigor. El JVIS puede calificarse manualmente, 
pero tal vez sea prefcrible la califtcaci6n por 
computadora, dado que cl usuario obticnc en- 
tonccs varios grupos adicionales de escalas, in- 
cluyendo datos sobre la semejanza de la persona 
evaluada con estudiantes universitarios que se 
especializan en disciplinas acaddmicas cspcct- 
ficas. El JVIS es adecuado para estudiantes dc 
preparatoria y mayores. 

Varias caracterfsticas distinguen al JVIS del 
SII y de otros inventarios dc intereses. Prime- 
ro, el JVIS utiliza un formato ipsativo dc op- 
ci6n multiple donde las personas examinadas 
deben seleccionar su opcidn preferida entre dos 
altcmativas. Los reactivos en cl JVIS se ase- 
mejan a los siguientes: 

A. Actuar en una obra teatral escolar. 

B. Ensenar a los niiios a escribir. 

A. Tejer colchas con disefios de omato. 

B. Comprar mobiliario para una cadena de 
liendas. 
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A. Escribir un texto de matemdticas para 
nifios de primaria. 

B. Estudiar cl dcsarrollo financicro de un 
banco local. 

Aunquc sc Ic utili/a en raras ocasioncs, el for¬ 
mato de reactivos dc opcidn forzosa dene la 
venlaja de reducir el impacto de la dcscabilidad 
social sobre los resullados de la prueba. Una 
scgunda caractcrfstica distintiva del JVIS es que 
Jackson utilizd un m&odo racional y guiado por 
la (eori'a para la derivacidn de las cscalas, mas 
que cl enfoquc empfrico que sc cncuentra cn la 
mayor parte dc los demds instrumentos. Como 
resultado dc estos dos aspcctos, las escalas del 
JVIS poscen mayor indcpcndcncia cntre sf en 
comparacidn con la que se encucntra cn otros 
instrumentos y tambidn son bastante puras 
factorialmentc. Como cvidcncia de la homoge- 
ncidad de las cscalas. las correlaciones biseriales 
cntre reactivos confirmados y puntuacioncs de 
escala sc cncuentran por io comun en la parte 
superior del rango de .60 y en la parte inferior 
del dc .70. 

Las normas del JVIS se cstablccicron con 
una mucstra muy amplia —aproximadamente 
8 000 estudiantes de preparatoria y universi- 
dad. No obstante, estos individuos eran cn su 
mayorfa estudiantes de Pennsylvania y dc la 
Provincia dc Ontario, de modo que su repre- 
sentacidn dc la poblacidn general es cucstiona- 
ble. La confiabilidad es cxcelentc, al mcnos a 
corto plazo, con coeficientes test-retest dc una 
a dos semanas que, por Io comun, sc cncuen¬ 
tran a la mitad del rango de .80. Con base cn un 
grupo cclectico de estudios que se presentan 
en cl Manual, la validez concurrente y predic- 
tiva parccc prometedora, pero se requiercn es¬ 
tudios adicionales para reforzar la confianza cn 
cste instrumento (Shepard, 1989). 

ESTUDIO DE INTERESES GENERALES 
DE KUDER 

El Kuder General Interest Survey, KGIS (Estu- 
dio de Intcrescs Generales de Kuder), repre- 
senta la evolucidn mds rcciente en una serie de 


inventarios de intereses vocacionales de Kuder 
que han sido sumamente respetados y que se 
han dcsarrollado cn los ultimos 50 anos. El pri- 
mero de estos instrumentos, el Kuder Preferen¬ 
ce Record (Registro de Preferencias de Kuder), 
se publied cn 1939. Estc instrumento introdujo 
un intcresante formato de rcspucsta dc clcccidn 
forzosa que ha sobrevivido hasta la actualidad 
(y que se analiza mils adclante). El Registro de 
Preferencias atrevesd pordiversas revisiones y 
surgid en 1979 como cl Kuder Occupational 
Interest Survey -Revised (KOIS, Kuder y 
Diamond, 1979) (Estudio de Intereses Ocu- 
pacionalcs de Kuder). El KOIS-R es una prue¬ 
ba muy conocida que produce puntuaciones 
para mds de 100 grupos ocupacionalcs y casi 
50 especialidades universitarias. La poblaci6n 
meta para el KOIS-R es aproximadamente 
la misma que la del SII y del J VIB. Para el pro- 
pdsilo dc presentar una diversidad de pruebas de 
interes, es mds instructivo analizar el KGIS aquf. 

El KGIS es unico entre los inventarios dc 
interds cn cuanto a que su poblacidn meta sc 
restringe a los adolcscentes en los grados esco- 
lares de bachillcrato (Kuder, 1975). La prueba 
requiere s6lo de un nivel dc lectura del sexto 
grado y la puedc aplicar el maestro del grupo y 
calificarla manualmcntc cn el mismo momento. 
Asf, el KGIS es muy adccuado para el desarro- 
llo dc metas cducativas y vocacionales en los 
primeros anos formativos dc la adolescencia. 

El KGIS tambidn es poco comun en cuan¬ 
to a su metodologta. El inventario utiliza un 
formato de trfada con rcspucsta forzosa para 
medir los intereses. En tdrminos especfficos, 
cada reactivo en la prueba requiere que la per¬ 
sona evaluada indique las alternativas que mds 
le agradan y las que mcnos de entre tres afir- 
maciones. Estc enfoque de eleccidn forzosa es 
particularmente adccuado para identificar in¬ 
dividuos evaluados que no han respondido con 
sinceridad a los reactivos. 

El inventario con 168 reactivos produce 10 
calificaciones de intereses que lienen, en gran 
medida, una naturaleza ipsativa. El lector rc- 
cordard que las calificaciones en una prueba 
ipsativa reflejan variabilidad intraindividual mds 
que intcrindividual. Con el KGIS, la compare- 
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ci6n con un grupo externo de rcfcrencia ticne 
importancia secundaria para dcterminar las pun- 
tuaciones.* Asi, una calificacidn alta en un drea 
de intcres significa principalmente que la per¬ 
sona evaluada prefirid con mayor frccucncia 
dicha drea en vez de otras en las reactivos de 
eleccidn forzosa. 

Las 10 cscalas rcflejan areas amplias de 
intcrds: Exteriores, Mecdnica, Computacidn. 
Cicntffica, Pcrsuasiva, Artfstica, Literaria, Mu¬ 
sical, Servicio Social y Administrative. Una 
unddeima eseala. la Escala de Verificacidn, sc 
diseild para determinar la sinceridad de las 
respuestas. El manual presenta cuantiosos da¬ 
tes test-retest, de consistencia interna y de es- 
tabilidad con base en una muestra de 9 819 
estudiantes en bachillcrato. Los datos de con¬ 
sistencia interna y de test-reiest a seis semanas 
son aceptablcs en terminus generates, donde los 
estudiantes de mayor edad mostraron correla- 
ciones test-retest mds elevadas. La posible cx- 
cepcidn a la buena confiabilidad es la Escala 
Pcrsuasiva (rclacionada con los puestos de ven- 
tas), que muestra corrclacioncs test-retest de .69 
y .73, respectivamentc, para varoncs y nifias en 
bachillerato. 

Los datos de estabilidad en un seguimien- 
to a cuatro anos son mcnos notables. El coefi- 
ciente promedio de estabilidad es de s6!o .50 y 
para personas con Cl bajo (menos de 100) es 
incluso menor, tan bajo como .19 para la Escala 
Adminislrativa. Esto es desafortunado ya que los 
adolesccntcs con Cl bajo cstdn en mayor pro- 
babilidad de ingresar a campos ad mini strati vos 
que aqudllos con Cl alto. No obstante, la medi- 
ci6n de los intereses administrativos es suma- 
mente inestable precisamentc para este grupo. 

COMENTARIO SOBRE EL KGIS 
Y OTROS INVENTARIOS DE INTERESES 

Si se considera la dificultad dc la tarea que sc 
emprende —la medicidn de los patrones am- 


* En rcalidad, cl KGIS cs solo parcialmcntc ipsativo. 
Algunas de las trfadas dc los reactivos obticncn pun- 
tuacioncs para mds de una escala. 


plios dc intereses de las adolesccntcs—el KGIS 
Irene un desempefio a nivcl accptable. En bachi¬ 
llerato, los resultados del KGIS pueden alcntar 
a los adolescentes a explorar nuevas experien¬ 
ces relacionadas con sus intereses medidos; en 
bachillerato, los resultados pueden ayudar a los 
estudiantes a planear sus cursos de educacidn 
media; y en bachillerato, los resultados pueden 
ayudar a los estudiantes a tomar dccisiones vo- 
cacionalcs tentativas. 

Pcro cl KGIS sufre de las mismas deficien- 
cias centrales de todos los inventarios dc inte- 
rescs cxistentcs, una total falta de atencidn a la 
oportunidad. Williams y Williams (1985) han 
expresado bicn csta cuestidn: 

... para aquellos que buscan especiflcamente 
una medida de inierds, el Kuder es. de manera 
definitiva, una medida aceptable. Pero et interns 
es sdio un extremo del triunvirato mteres-capa- 
cidad-oportunldad. El extremo mds importante, 
la oportunidad, ha generado el menor interds 
psicomelrico. B que esto sea asf no es sorpre- 
sa. La oportunidad es, con mucho, el constructo 
mds dilicil de delinir; pero aquellos que traba- 
jan en orlentacldn de carrera nunca deben igno- 
rarlo, sin importar la dificultad en la medicwJn y 
deflnickJn. 

Se le rccucrda al lector que la falta de atencidn 
a la oportunidad es comun para todas las medi- 
das dc intereses. aunque quizes este es un pro- 
blema mds grave para el KGIS, debido a que es 
un instrumento que se utiliza con personas que 
aun no han ingresado en cl mercado laboral. 

INVENTARIO DE PREFERENCIA 
VOCACIONAL 

El Vocational Preference Inventory , VPI (In- 
ventario de Preferencia Vocacional), es un in- 
ventario objetivo, de lapiz y papel, para la 
medici6n de la personalidad e intereses, que se 
utiliza en la evaluacidn vocacional y de carrera 
(Holland, 1985c). El VPI mide 11 dimensiones 
que incluyen los seis temas de personalidad- 
ambicntaiesdenominados: Realista, Investigador, 
Artfstico, Social, Emprendedor y Convencional; 
y cinco dimensiones adicionales de Autocon- 
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trol. Masculine>/Feme 111 no, Hstatus. Infrecuencia 
yConformismo. Los reactivos de la pruebacon- 
sisten de 160 tftulos ocupacionales hacia los 
cuales la persona evaluada expresa un senti- 
micnto al marcar s (s0 o n (no), El VIM es una 
prueba breve (15 a 30 minutos) y sc dirige a 
personas de 14 aiios de edad y mayores con 
jnteligencia normal. 

Holland propone que los rasgos de per- 
sonalidad tienden a agruparse en un pequeno 
numero de patrones relacionados vocacional- 
mentc, dcnominados tipos. Para cada tipo de 
pcrsonalidad cxiste tambiln un ambiente la- 
boral corrcspondiente que cs el m.1s adecuado 
para dste. Segun Holland, existen scis tipos: 
Realista, Invcstigador, Artistico, Social, Emprcn- 
dedor y Convencional. En ocasioncs esto sc co- 
nocc como cl modclo RIASEC, en referencia 
a las iniciales de los seis tipos. £stos son idealiza- 
ciones en las que pocas personas (o ambientes) 
encajan por completo. No obstante. Hoi land con- 
sidcra que la mayorfa de los individuos tienden 
a parecerse mds a un tipo que a otros. Adcmds. 
los individuos tambidn muestran menor grado 
de semejanza con un segundo y tcrcer tipos. 

Se pueden resumir los tipos de personali- 
dad-ambientales como siguc: 

• Realista: alldtico, carece de habilidadcs ver- 
balcs e intcrpersonales y preftere vocaciones 
manuales o en exteriores como las de meed- 
nico, granjero o elcctricista. 

• Invcstigador: pensador orientado a la (area, 
con actitudes poco convencionalcs que enca- 
ja bien en puestos cientificos o acaddmicos 
como los de qufmico, ffsico o bidlogo. 

• Artistico: individualista, evita situaciones 
convencionalcs y preftere metas estdticas. 

• Social: utiliza sus capacidadcs sociales para 
resolver problemas, le agrada ayudar a otras 
personas y preftere profcsioncs relacionadas 
con enseflanza o ayuda. 

• Emprendedor: un Itder con buenas habili- 
dades de convcncimiento, que cncaja bien en 
puestos comerciales y administrativos. 

• Convencional: conformista y preftere roles 
estructurados como el de cajero de banco u 
operario de computadoras. 


Los seis temas en cl sistema RIASEC pueden 
ordenarse en un hexdgono con los temas si mi- 
lares lado a lado y los temas diferentes en lados 
opuestos, como sc representa en la ftgura 12-1. 

Los coeficicntcs de conftabilidad test-retest 
para las scis escalas principals van de .87 a 
.97. Las normas del VPI se basan en grandes 
muestras pertinentes de cstudiantes universita- 
rios y adultos con empleo de cdiciones antcrio- 
res del VPI. Las caracterfsticas de la muestra 
de estandarizacidn no estdn bien definidas, lo 
cual hace que las normas sean un tanto difi'ei- 
les de interpretar (Rounds, 1985). 

La validcz del VPI se vincula de mancra 
esencial con la validez del modclo hexagonal 
de Holland (1985a) sobre los intereses voca- 
cionalcs. Literalmcntc cicntos de estudios han 
examinado este modelo desdc perspectivas 
diferentes. Aquf se citardn las (cndencias y 
estudios representatives. Se rcficre al lector a 
Holland (1985c) y Walsh y Holland (1992) para 
mayores detalles. 

Varios estudios sobre cl VPI han investiga- 
do una cucstidn clave en la tcorfa de Holland — 



Convencional 

ConforrmdacVDalos 



Invcstigador 

PcnsamlentcVIdeas 


Emprendedor 

AdmintslraciOn/Personas 


Artistico 

CreaoOn/ldeas 


Social 
Ayuda/Personas 


Flgura 12-1. Modelo hexagonal de temas ocupaciona¬ 
les de Holland. 

Fuente: Reproduodo con autorizacion de Lowman, R. L 
(1991). The clinical practice ot career assessment: 
Interests, abilities, and personality. Washington, DC: 
American Psychological Association Copyright © 1991 
de la American Psychological Association. 
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el quc las individuos tiendcn a dirigirse a am- 
bientes que son congruentes con sus tipos de 
personalidad. Si esta suposicidn es correcta, 
cntonces la cquiparacidn en la vida real de am- 
bicntcs de irabajo y lipos de personalidad de 
los empleados deberfa ser sustancial. Deberfa 
csperarse encontrar que los ambicntcs Realis- 
las tiencn principalmenlc empleados Realistas, 
que los ambientes Sociales tienen principal men- 
te empleados Sociales, y asf sucesivamente. La 
invcstigacidn sobrc esle tcma ha seguido una 
melodologfa sencilla: se examina a las perso¬ 
nas con cl VPI y se les clasifica segun sus lipos 
de Holland (utilizando hasta seis letras); des¬ 
puds se clasifican de manera independientc 
los ambienles laboralcs de los individuos a tra- 
vds de medidas ambicntales apropiadas; por 
ultimo, se calcula el grado de congrucncia en- 
trc personas y ambicntcs. En mejores estudios 
tambidn se aplica una correccidn para la con- 
cordancia aleatoria. 

Al utilizar cl modelo hexagonal. Holland 
ha desarrollado claves ocupacionalcs como base 
para clasiftcar los ambientes de trabajo. Por 
ejemplo, el arquitecto de paisajes liene la clave 
RIA (Realista, Investigador, Artfstico), porque 
sc sabe que esta ocupacidn es un oficio tdeni- 
co, calificado (componente Realista) quc rc- 
quiere habilidadcs cicnlfficas (componente 
Investigador) y tambidn demanda aptitudes ar- 
tfsticas (componente Arti'stico). El componen¬ 
te Realista se lista en primer lugar porque es el 
mds importante para el arquitecto de paisajes, 
mientras quc los componentes Investigador y 
Artfstico son de importancia secundaria y ter- 
ciaria, respcclivamentc. Algunas otras ocupa- 
ciones y sus claves son taxista (RSE), maestro 
de matcmdticas (ISC), reportero (ASE), oficial de 
poliefa (SER), valuador de biencs rafees (ECS) 
y secretaria (CSA). De modo similar, Holland 
ha elaborado claves para diferentes cspeciali- 
dades universitarias. 

Un enfoque para los estudios de congruen- 
cia consistc en comparer los resultados en el 
VPI de estudiantes o trabajadorcs con las cla¬ 
ves de Holland que corresponden a sus espe- 
cialidades universitarias u ocupaciones. Por 
ejemplo, las claves del VPI de Holland para una 


mucstra de oficiales de poliefa deberfan con- 
sistir principalmcntc de perfiles quc comienzan 
con S y deberfa contencr una proporcidn de 
perfiles SRE mayor a la debida a factores 
aleatorios. Lo que es mis, cl grado de congruen¬ 
ce deberfa rclacionarsc con cl grado de satis- 
faccidn expresada en rclacidn con esa Ifnea dc 
trabajo o de estudio. 

La invesligacidn con estudiantes universi- 
tarios proporciona fuerte apoyo a la prcdiccidn 
de congrucncia: las estudiantes tiendcn a selec- 
cionarc ingresar a especialidadcs universitarias 
quc son congruentes con sus tipos principales 
de personalidad (Holland, 1985a; Walsh y 
Holland, 1992). Asf, los tipos Artfslicos tienden 
a cspecializarsc en arte, los tipos Invcstigado- 
res tienden a cspecializarsc en biologfa y los 
tipos Emprendedores tienden a cspecializarse 
en comercio, por citar sdlo unos cuantos ejem- 
plos. Estos resultados proporcionan una fuerte 
sustcntacidn al VPI y a la tcorfa sobre la cual 
sc basa. 

Esta corta resefia apenas ha locado la su- 
pcrficie dc los estudios de validez quc apoyan 
al VPI. Walsh y Holland (1992) citan varias If- 
neas adicionalcs dc invcstigacidn que apunta- 
lan la validez dc su prueba. Pero no todos los 
estudios acerca del VPI afirman su validez. 
Fumham, Toop, Lewis y Fisher (1995) no lo- 
graron encontrar rclacidn entre “adecuacidn" 
persona-ambiente (P-A) y satisfaccidn con el 
trabajo, un fundamento tedrico esencial de la 
prueba. Segun la tcorfa dc Holland, entre mejor 
sea la adecuacidn P-A, mayor seri la satisfac- 
cidn con el irabajo. En Ires mucslras britini- 
cas, las relacioncs cran debiles o incxistcntcs, 
lo cual sugicrc la posibilidad de quc cl VPI no 
se “trasladc bicn” a cultures fucra dc los EUA. 

Aunque hasta cste momento se han enfa- 
tizado principalmcntc las fortalezas del VPI, 
incluso los autores de la prueba reconocen quc 
existen posibilidades de mejorfa. Por ejemplo, 
Walsh y Holland (1992) citan las siguientes 
dcbilidadcs del VPI: 1) los conceptos acerca de 
ambientes vocacionalcs sdlo se han evaluado 
de manera parcial; 2) las hipdtesis acerca de las 
interecciones persona-ambiente requieren de 
considerable trabajo adicional de investigacidn: 
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3) las formulaciones acerca del desarrollo per¬ 
sonal han recibido cierto apoyo, pero necesitan 
mayorcs examencs arnplios; 4) la clasificacidn 
de las ocupaciones pucdc difcrir dcpcndicndo 
del inslrumento quc se utilice para cvaluar los 
tipos de pcrsonalidad y 5) existcn contingen- 
cias personales y ambicntalcs quc en la acluali- 
dad se cncuentran fuera del espectro de la tcoria. 

La tiltima dcbilidad es, quiza, la mds gra¬ 
ve. Dcspuds de todo, cn la actual idad el enfo- 
que de evaluacibn del VPI no rcconoce ningun 
papel para la cducacibn, inteligencia y aptitu¬ 
des especialcs, excepto cn la mcdida en quc 
estos factorcs podrfan tencr una injerencia in- 
dirccta sobrc la pcrsonalidad y los intcrcses 
vocacionalcs. Sin embargo, el sentido comun 
dicta que la capacidad intclectual tendra mu- 
cho que ver con la satisfaccibn vocacional cn 
algunas profesioncs, independientemente dc la 
adccuacion entre tipo dc pcrsonalidad y ambien- 
tc de trabajo. Para un mayor andlisis sobre el 
VPI y la tcorfa sobre la cual se basa, cl lector 
puede consul tar a Gottfrcdson (1990), Holland 
(1990) y Holland y Gottfrcdson (1990). 

BUSQUEDA INDEPENDIENTE 

Holland siempre ha mostrado un gran interds 
en las aplicacioncs practicas de su investiga- 
ci6n para el desarrollo vocacional. Dc acucrdo 
con estc inlerds, ha desarrollado la Busqueda 
Indepcndientc, una prueba breve, sumamentc 
prftctica, alractiva por su scncillcz (Holland, 
1985ab). Como el nombre sugicre, se disefib 
para ser una prueba dc intercses vocacionalcs 
quc aplica, califica e interpreta el mismo indi- 
viduo evaluado y mide los seis temas vocacio- 
nales RIASEC que sc describieron antes. 

Esta prueba consistc cn rcacti vos dicotbmi- 
cos que la persona examinada marca como 
“agrado” o “desagrado" (o “sf' o “no”) en cua- 
tro secciones: 1) Actividades (6 esealas de 11 
reactivos cada una); 2) Compctcncias (6 esea¬ 
las dc 11 reactivos cada una); 3) Ocupaciones 
(6 esealas de 14 reactivos cada una), y 4) Esti- 
mados personales (2 conjuntos de 6 califica- 
ciones). Para cada seccibn, los reactivos con 


validez evidente se agrupan segun los temas 
RIASEC. Para cada tema, el numero total de 
respuestas de “agrado” o “sf se combina con 
los cstimados personales dc capacidad para 
obtcncruna ealificacibn total de tema. La prue¬ 
ba rcquierc dc 30 a SO minutos y se dirige a 
personas de IS aiios y mayorcs. 

Los temas RIASEC cn Busqueda Indepen- 
diente mostraron confiabilidadcs lest-retest quc 
van de .56 a .95 y consistencies intemas quc van 
de .70 a .93. Las normas para las esealas y 
claves de esta prueba se presentan para mucs- 
tras pertinentes combinadas de 4 675 estudian- 
tes de educacibn media, 3 355 estudiantes 
universitarios y 4 250 emplcados adultos con 
edadcs dc 16 a 24 afios (Holland, I985ab). No 
obstante, los resultados sc interpretan, por lo 
comun, de manera individualizada, ipsativa 
(“ila ocupacibn es adecuada para estc clicn- 
te?”), de modo quc los datos normativos ticncn 
relevancia limitada. 

Busqueda Indepcndientc cstb disponiblc en 
una versibn de Ibpiz y papel para ealificacibn 
manual, y tambien para computadora. Por 
desgracia, la version de Ibpiz y papel esti pro- 
pensa a una tasa dc 16% dc errores de califica- 
cibn cuando la utilizan estudiantes dc cducacibn 
media (Holland, I985ab). La prueba para compu¬ 
tadora personal, prbctica para el usuario, es 
probablcmente la versibn preferida debido a la 
facilidad de aplicacibn y a su ealificacibn e in- 
terpretacibn librc dc errores. 

Cuando un indi viduo rcaliza esta prueba se 
utilizan las ties calillcaciones m.1s clevadas de 
tema para denotar una clave dc resumcn. Por 
ejemplo, una persona cuyas tres calificaciones 
mAs alias se colocaron cn Investig<idor, Artfsti- 
co y Realista, tendrfa una clave de resumen de 
IAR. En un follcto indepcndientc que se dislri- 
buye con la prueba —cl Buscndor dc ocupa- 
cioncs— la persona examinada pucdc buscar 
su clave de resumen y cncontrar una lista dc 
ocupaciones m£s adecuadas. Por ejemplo, 
un indi viduo con una clave dc resumcn JARen- 
contrarfa que se asemeja mas a las personas en 
las siguientes ocupaciones: antropdlogo, astr6- 
nomo, qufmico, patologo y ffsico. El protocolo 
de prueba conticne informacidn adicional que 
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ayucia a la persona evaluadu a explorar opcio- 
nes rclacionadas dc carrera. 

Busqueda lndependiente salisface un pro- 
posilo muy util al proporcionar un formato r5- 
pido y scncillo para inslara las personas jdvenes 
a examinar sus altcrnativas profesionales. Al 
climinar el proceso lento de aplicacidn, califi- 
cacidn, interprctacidn y rcalimenlacidn del 
orientador, la prueba posibilita que un publico 
amplio reciba un nivel introductorio de orien¬ 
tation vocacional. Holland (1985ab) propone 
que esta prueba es apropiada hasta para 50% de 
estudiantes y adullos que podrian descar orien- 
tacidn vocacional. Supuestamentc. para cl otro 
50%, puede pareccr una base insuficicntc para 
la cxploracidn dc carrera. Holland (1985ab) 
advierte de manera correcta a los usuarios que 
considercn todas las fucntes dc informacidn cn 
la elcccidn de profcsidn. y que no se bascn de- 
masiado en las calificacioncs de prueba por sf 
solas. Levinson (1990) analiza la integraci6n 
dc los datos dc Busqueda lndependiente con otros 
datos psicoeducativos para haccr recomenda- 
cioncs vocacionalcs especfficas a estudiantes 
dc educacidn media. 

La validcz de esta prueba se vincula con la 
validez del modelo hexagonal dc la personali- 
dad y los ambientes sobre los que se basa. Por 
tanto, un aspecto de la validcz es si cl modelo 
hacc predicciones que se confirmen a travds de 
los resultados de esta prueba en la vida real. En 
general, los resultados dc mds de 400 estudios 
apoyan la validez de constructo de Busqueda 
Independienie (Dumcnci, 1995; Holland, 
I985ab, 1987). 

Un planteamiento para determinar la vali¬ 
dcz consiste en determinar si las relacioncs en- 
tre las escalas dc esta prueba ticnen sentido 
tedrico. Como ocurre con el VPI, los seis te- 
mas RIASEC de Busqueda Independienie 
se pueden ordenar en un hcxdgono donde los 
temas similares cstdn juntos y los diferentes se 
encucntran cn lados opuestos. Por cjemplo, en 
la figura 12-2, los temas Artfsticoe Invesliga- 
dor se encuentran juntos. No es diffcil imagi- 
nar a una persona que combine ambos temas 
cn su pcrsonalidad y en su ambiente de trabajo. 
de modo que se puede predecir una correlacidn 


positiva moderada entre ellos. En una mucslra 
general de referencia de 175 mujeres entre 26 
y 65 anos, Holland (1985ab) encontrd que las 
calificaciones en estos dos temas se corrclacio- 
naron de manera modesta, r = .26, como po- 
drfa esperarsc. El lector tambidn verd que los 
temas Investigador y Emprendcdor se encucn- 
tran en lugares opuestos, lo cual significari'a 
enormes disparidades en estos dos patroncs 
ocupacionales. Estos temas no deberfan tener 
correlacidn. De hecho, las puntuaciones en 
estos dos temas se corrclacionan muy poco, 
r = -.02. En general, las corrclacioncs que se 
muestran en la figura 12-2 ticnen sentido te6- 
rico; estas conclusiones sustentan la validez de 
constructo de Busqueda Independienie. 

La validez predictiva de esta prueba se ha 
investigado en varias doccnas dc estudios que 
Holland ha resumido (1985ab, 1987). La me- 
todologia tfpica para estos estudios consiste en 
comparar las claves con las calificaciones mds 
alias de Busqueda Independienie de grandes 
mucstras de estudiantes con la primera Ictradc 
sus clccciones (o aspiraciones) ocupacionales 1 
a 3 afios despuds. En general, las conclusiones 
indican que Busqueda lndependiente licne una 
cficicncia dc prcdiccidn dc moderada a alia, dc- 
pendiendo de la edad de la muestra (las tasas 
dc acierto aumentan con la edad), la exten- 
si6n del inlervalo de tiempo (las tasas de acierto 
dcscienden con el tiempo), y la cntegoria es- 
pccffica pronosticada (las tasas de acierto son 
mejores para predicciones de los temas Investi¬ 
gador y Social); (Gottfredson y Holland, 1975). 

Las corrclaciones entre las escalas de Bus¬ 
queda lndependiente y una amplia variedad de 
medidas psicoldgicas (p. ej., pcrsonalidad. ap¬ 
titudes y valores) tambidn sirven para definirel 
significado de las escalas de esta prueba y. por 
tanto, ayudan a validar la prueba (Holland, 
1985ab, 1987). Por ejemplo, un estudto de 
Costa, McCrac y Holland (1984) investigd la 
relacidn entre las escalas dc Busqueda Indepen¬ 
dienie y el NEO Personality Inventory (Inven- 
tario NEO de personalidad) para una muestra 
de 217 varones y 144 mujeres con edadcs dc 
21 a 89 anos. Las escalas Investigador y Arlfs- 
ticodc Busqueda lndependiente mosiraron fucr- 
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Figura 12-2. Modelo hexagonal SDS y correladones entre escalas para 175 mujeres de 26 a 65 anos. 

Fuente: Adaptado y reprodocido con autorizacidn especial del editor del Self-Direclod Search Professional Manual 
de John L Holland, Ph D. Copyright Q 1985 de PAR. Inc. Derechos reservados. 


tes corrclacioncs positivas con la escata dc 
Apcrtura del NEO —una mcdida de la apertu- 
ra a las experiencias en las drcas dc fantasfa, 
scntimientos, acciones e ideas. Las escalas 
Social y Emprendcdor de Busqueda Indepcn- 
diente mostraron fuertes corrclacioncs con la 
cscala de Extraversidn del NEO— una mcdida 
dc la oricntacidn hacia el exterior y de la socia- 
bilidad. Las escalas Rcalista y Convencional de 
Busqueda Independiente revelaron s61o una 
corrclacidn trivial con las escalas NEO. En ge¬ 
neral, las correlaciones observadas fueron con- 
sistenles con la intcrprctacidn de las escalas I, 
A, S y E y proporcionan buena sustcntacibn para 
su validez. Aunque los resultados de este estu- 
dio no prestan apoyo a la validez de las escalas 
R y C, muchas otras investigacioncs han pro- 
ducido conclusiones confirmatorias (Holland, 
I985ab). Schinka, Dye y Curtiss (1997) pro¬ 
porcionan un concienzudo analisis y discusidn 
sobre la relacidn entre las dimensiones del NEO 
y las escalas de la SDS. 


ENCUESTA CAMPBELL DE INTERESES 
Y HABIUDADES 

El Campbell Interest and Skill Survey, CISS 
(Estudio Campbell dc Intcreses y Habilidades; 
Campbell. Hyne y Nilson, 1992), es una medida 
mas nueva de autoinforme de intereses y habili- 
dadcs. La prucba se diseno para ayudar a los 
individuos a tomar mejores decisiones de ca- 
rrera al describir la manera en que sus intereses 
y habilidades se adaptan al mundo laboral. La 
principal poblacidn mctadcl CISS laconforman 
estudiantes y jdvenes adultos que no han tngresa- 
do al mercado laboral, pero la prucba tambidn 
es adccuada para trabajadorcs de mayor cdad que 
estdn considerando un cambio de carrera. La prue- 
ba es apropiada para individuos de 15 anos de 
cdad y mayores con un nivel de lectura de sex¬ 
to grado. aunque en circunstancias excepcio- 
nalcs puede cxaminarse a ninos mis pequeiios. 

La CISS consiste de 200 reactivos de inte¬ 
reses y 120 reactivos de habilidad. Los prime- 
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ros incluycn ocupaciones, matcrias escolares y 
divcrsas actividades de trabajo quc la persona 
evaluada califica en una escala dc seis pun- 
los desde fuerte agrado hasta fuerte desagrado. 
Los reactivos dc intcreses se asemejan a los 
siguientes: 

Un piloto quc vucla una acronavc comer- 
cial. 

Un biOlogo quc inibaja cn un laboratorio 
dc invcstigacibn. 

Un detective de policia que resuelve erf- 
mcnes. 

Los reactivos dc habilidad incluycn una lista dc 
actividades quc la persona evaluada califica cn 
una escala dc seis puntos desde experto (anv 
pliamente reconocido como excelente en esta 
area), hasta ninguna (no tiene habilidadcs cn 
esta iSrea). Los reactivos dc habilidad se parc- 
cen a los siguientes: 

Ayudar a una familia a resolver sus con- 
flictos. 

Hacer mueblcs utilizando carpintcn'a y hc- 
rramientas electricas. 

Hscribir una historia para una revista. 

Los resultados del CISS sc califican cn dife- 
rentes tipos de escalas: Escalas dc oricnla- 
cidn, Escalas de intcreses y Habilidadcs bdsicas, 
Escalas ocupacionalcs, Escalas cspccialcs y 
Vcrificacioncs de procedimiento. Todas las ca- 
lificaciones de escala se presentan como pun- 
tuacioncs T, con normas para un promedio de 
poblacibn de 50 y desviacidn cstandar dc 10. 

Las Escalas de orientacibn sirven para or- 
ganizar cl pertll del CISS —las escalas dc inte- 
rcscs, habilidadcs y ocupacionalcs sc presenta 
bajo las Orientaciones apropiadas. Las siete 
Oricntaciones son las siguientes (Campbell y 
cols., 1992, pp. 2-3): 

• Influcncia —influir en otras personas a tra- 
vds del liderezgo, polftica, oratoria publica y 
mcrcadotccnia. 

• Organization —organizar el trabajo de otros, 
administracibn y vigilancia del desempeno fi- 
nanciero. 


• Ayuda —ayudar a otros a traves de la ense- 
hanza, curacion y oricntacidn. 

• Creation —creation dc producciones artfs- 
licas, literarias o musicales, y diseno de pro- 
ductos o ambientes. 

• Analisis —andlisis de datos, a traves de las 
matembticas y realization de experimentos 
cicntfficos. 

• Production —elaboration de productos, uti¬ 
lizando habilidadcs “manuales” cn agricultu¬ 
re, construction y oftcios mecdnicos. 

• Aventura —busqueda dc aventuras, compe- 
tencia y situaciones que impiican riesgo a tra- 
vds de actividades atlbticas, policiacas y mi- 
litarcs. 

Existen 29 pares de Escalas bdsicas, y cada uno 
consistc de escalas paralelas de interds y habi¬ 
lidad. Las Escalas bdsicas se agrupan dentrode 
side Oricntaciones que sc basan cn sus in- 
tercorrelaciones. Por cjcmplo, la Oricntacidn de 
Ayuda contienc las siguientes Escalas bdsicas, 
cada una de las cuales tiene components se- 
parados dc interes y habilidad: Desarrollo adul- 
to, Orientacidn, Desarrollo infantil, Actividades 
religiosas y Prdctica mddica. 

Los 58 pares de Escalas ocupacionales, 
cada una dc las cuales tiene componentes se- 
parados dc interds y habilidad, proporcionan 
realimcntaciOn acerca del grado de semejanza 
entre la persona evaluada y los trabajadorcs 
satisfechos dentro de esa ocupaciOn. Estas es¬ 
calas sc conslruyeron de manera empfrica al 
contrastar las respuestas de personas que se 
cncontraban satisfechas con su empleo cn ocu- 
pacioncs cspcciTicas, con las respuestas de una 
muestra global dc referenda que se obtuvo de 
la poblaciOn trabajadore en general. 

Ademas de las Escalas bdsicas y Ocupa¬ 
cionalcs, la CISS incorpora tres escalas cs- 
pecialcs: Enfoquc acaddmico, una medida del 
interds y la confianza cn las actividades inte- 
lectuales, cientfficas y literarias: Extraversibn, 
una medida de la extraversibn social; y Varie- 
dad, una medida de la amplitud de los intereses 
y habilidades de la persona evaluada. Por ulti¬ 
mo, el CISS muestra una diversidad de Verifi- 
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caciones de procedimicnto para detectar posi- 
blcs problcmas en la presentacibn dc la prueba, 
como las respuestas aleatorias o las omisioncs 
excesivas. 

En tdrminos generalcs, la confiabilidad dc 
las cscalas del CISS cs cxccpcionalmente fuer- 
te. Por cjemplo, el coeficientc alfa para las Es- 
calas de orientacidn se coloca por lo comiin en 
la parte alia del rango de .80 y las confiabilida- 
des test-retest para 324 personas se encucntran 
en la parte media a alta del rango del .80. Se 
prcscntan conclusiones si mi lares sobrc confia¬ 
bilidad para las Escalas bdsicas y Ocupaciona- 
les. Las normas del CISS sc basan en 5 000 
individuos distribuidos en 58 ocupaciones. Los 
aulorcs in forman de extensos datos dc validcz 
para las Escalas ocupacionalcs, incluycndo 
medias dc muestra para cada mucstra ocupa- 
cional, asf como listas de las ires ocupaciones 
con calificaciones mas altas y mas bajas en cada 
cscala (Campbell y cols., 1992). Estos datos 
documentan que las cscalas discriminan entre 
ocupaciones de una manera cficaz y significa- 
tiva. Por cjemplo, cl promedio dc la punlua- 
cibn T en Contabilidad para los contadorcs cs 
de 75.8. Las personas dcdicadas a la estadfsti- 
ca, tenedurfa y planificacibn financicra logran 
las siguientes tres calificaciones mbs altas para 
esta escala, con puntuacioncs T promedio en la 
parte baja del rango de 60. Los artistas comer- 
ciales, profesores y trabajadorcs socialcs obtie- 
nen las ires calificaciones mbs bajas, con un 
promedio en puntuacibn T de alredcdor dc 40. 
Estos rcsultados brindan apoyo a la validcz del 
CISS debido a que sc adccuan bien a las cx- 
pcctativas acerca de los patroncs ocupaciona¬ 
lcs de intereses y habilidadcs. 

Casi con loda seguridad estc instrumento 
recibird mayor atencibn en los anos por venir. 
Una caracterfstica digna de atencibn en el CISS 
es la amplitud y claridad del protocolo de in- 
formc del perfil. £ste consiste dc II pdginas 
fdciles dc comprcnder para el usuario. Hemos 
rcimpreso dos de ellas en la figura 12—3 con 
propbsitos ilustrativos. Este formato cs preferi- 
blc a las grdficas detalladas, pero diffeiles de 
leer, que se encuentran en muchos instru- 
mentos. El CISS no tiene aun una fuertc funda- 


mcntacibn de conclusiones cmpiricas por par¬ 
te dc investigadores independientes. No obs¬ 
tante, la invcstigacibn conlirmatoria estd a la 
vuclla de la esquina y el CISS promete rivalizar 
con el Strong Interest Inventory para la orienta- 
ci6n vocacional de los adultos jbvenes. 


EVALUACION DE CARRERA 
Y DE VALORES DE TRABAJO 


En Working , su monumental discrtacibn acer¬ 
ca dc los estadounidenses en el trabajo, Studs 
Terkel concluyb que el trabajo cs una busqueda: 

... de signilicado cotidiano at igual que det sus- 
tento de cada dia, de roconocimionto as( como 
de dinero. de asombro en vez de apatia; en po- 
cas palabras, de una especlo de vida en lugar de 
una especie de muerto de tunes a viemes. QuizA 
la inmortalidad es parte, tambien, de la busque¬ 
da. Ser recordado lue el deseo, oxprosado y no 
expresado, de los heroes y heroinas de esle II- 
bro (Terkel, 1974). 

Las personas buscan significado en su trabajo. 
Despuds de cnlrevistar a cientos de uabajado- 
res, Terkel concluyb que sblo unos cuantos afor- 
tunados lo encuentran. Todos podemos 
recordar a dichos espfritus satisfechos: cl mi- 
nistro religiose que rccibc la adoracibn de su 
grey, el jardinero paisajista que deja un legado 
permanente, el mccbnico dc automotores que 
sc delcita cn una maquinaria perfectamente afi- 
nada, o cl historiadordc tradiciones orales que 
rescata un trozo del pasado. Pero cn contrastc 
con estos pocos, Terkel descubrib que la ma- 
yorfa alberga un “descontento apenas disimu- 
lado" acerca dc su trabajo. 

Ya sea que se estd de acucrdo o no con 
esta postura pesimista, es claro que los valores 
representan un papel importance en la satisfac- 
cidn con el trabajo, la clcccibn dc carrcra y cl 
dcsarrollo profesional. Esto es especialmente 
evidente cuando surge una disparidad entre los 
valores personates y los valores dominanles que 
requiere una camera. En su libro sobre cambios 
de camera, Jones (1980) rclata la historia dc un 
publicists que llegb a una conclusidn dolorosa 
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Figure 12-3. Secciones representatives del Campbell Interest and Skill Survey. 

Fuente: Reimpreso con autoruraciOn de Campbell, D P , Hyne. S. y Nielsen, D. (1992). Manual lor tho Campbell 
Interest and Skill Survey. Minneapolis, MN; National Computer Systems. Copyright Q de David Campbell, Pb 0. 
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personas. estaUecer las poUncas de la organuacldn y motivar a las personas a su alrededot 

Aoomas. usted tambien ha preseniado un alto nival de confianza on sus copecidedes de uderazgo y molnraeldn a otras 
personas Es probable qua dislrule estar a cargo de su propio dapanamento. division u organiz»c» 0 n y qua tenge mucha 
contianza an qua pueda tenor un desempeno adecuado Debido a qua sus cablieaciones tanto en Intereses como an 
Habrlldades son alias. Oita os un tree atraetiva pare usted 

Sus ginluecionet en las Escalas USsKas de influence, qua proporcionan mayoros detaaes sobre sus Intereses y Heblidades 
en esta Area, se mlorman arnba en el laoo Izqwerdo de la pOgma. Sus puntuaciones en las Escalas Ocupactonales de 
krlfcenoase pressman amca a manoderecnade la p*gina Cada ocupadOn tana una deve de leia a tree lelras qje indca su 
caSItoaciOn o ceir eocenes mbs alias en onentacidn Emre mds urrvler tea su clave de Orem arson a sus ceMIcaoonas mis 
alms en OnonsaexOn. sera mas probable qua usted so slants sabslecho oon un trabeyo en esa oeupacxdn. 
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a mi tad dc la vida: “Me desagrada el punto cen¬ 
tral de mi trabajo. La publicidad dc productos 
deficientes esta danando al pafs[—] Todo lo rc- 
lacionado con la publicidad pareefa incorrcc- 
to” (p. 27). Esta persona sc encontraba tan 
insatisfecha con su vocacibn que cambib a otro 
catnpo a mitad de su vida. En aparicncia, valo- 
raba cl servicio hacia los demds —un valor de 
trabajo que chocaba de frente con la postura 
amoral predominantc cn la publicidad. Sblo 
podemos preguntamos cbmo cs que eligib una 
carrera tan dispar desde un principio, pero pa- 
rcce poco probable que fuera una eleccibn ra- 
cional basada cn una cvaluacibn dc sus valores 
laborales. 

Tambidn valdrfa la pena pregunlar la fuen- 
tc del descontcnto que Terkel descubrib. ^El 
descontento es, en gran medida, algo inevita¬ 
ble, inherente a la misma naturaleza del traba¬ 
jo? (.0 surge, al mcnos en parte, de milloncs dc 
discrepancias individuates entre lo que ofrece 
un cmplco y lo que cl trabajador neccsita? 

En esta scccibn sc extendera la cxplicacibn 
sobre la materia que se desarrollb cn el tema 
anterior —la clcccibn dc carrera puede mejo- 
rarsc a lraves de la aplicacibn apropiada dc he- 
rramientas de evaluacibn dc carrera. El lector 
cncontrarfl primero las pniebas individuales de 
valores laborales y dcsarrollo profcsional. A 
continuacibn, se analiza el modelo integrador 
de evaluacibn de carrera. En este enfoque, se 
integran las capacidades, intercses y caractc- 
nsticas dc pcrsonalidad para la orientacibn 
vocacional. El capitulo cierra con el tema rela- 
cionado de evaluacibn del consumidor. 

Los valores laborales sc reficren a las ne- 
cesidades, motivos y valores que influyen la 
eleccibn vocacional. la satisfaccibn con el tra¬ 
bajo y el dcsarrollo profesional. Incluso cuan- 
do se mantienen constantcs los factores basicos 
como inteligcncia, cducacibn y capacidad, es 
claro que los individuos diftcren en cuanto a 
sus valores laborales. Aquello que una persona 
desea de su trabajo podrfa scr francamente re- 
pugnante para otra de igual inteligencia, edu- 
cacibn y capacidad. 

A continuacibn se presenta una historia teal 
para ilustrar este punto. En representacibn de 


varias familias, un abogado especializadoen 1c- 
siones personales presentb una demanda cn 
contra dc una cnormc corporacibn minera. Sc 
acusaba a la companfa minera de arrojar cmi- 
siones venenosas de una fundicibn dc plomoal 
ambiente que respiraban cicntos de residentes 
dc una pcqueiia poblacibn, lo cual causaba dano 
neurolbgico sutil a docenas de ninos. En la de¬ 
manda participaron mbs de 20 testigos exper- 
tos y se prolongb por varios anos. El abogado 
tenia fuertes deudas debidas al financiamien- 
lo del liligio pendiente —enfrentaba la banca- 
rrota si la demanda fallaba. No obstante, sc en¬ 
contraba jubiloso a medida que sc aproximaba 
la fccha de la confrontacibn final ante la Cortc 
Federal de EUA, con su futuro profesional en 
la cucrda floja. Para este individuo, los riesgos 
peligrosos eran un valor laboral aprcciado. En 
contrastc, la mayorfa dc las personas evitarfan 
de manera acti va esta especie de juego de upucs- 
tas con sus carreras. 

Una combinacibn apropiada entre valores 
laborales y clcccibn dc carrera es csencial para 
la satisfaccibn con cl trabajo. Algunas perso¬ 
nas tienen bxito en encontrar dicha combina¬ 
cibn. Por ejemplo, cl intrbpido abogado que sc 
mcnciona antes era muy adecuado para su sen- 
da profesional. Pero para aquellos inseguros 
acerca de la eleccibn de carrera, la realimen- 
tacibn acerca de valores laborales puede pro- 
porcionar una orientacibn muy necesaria. Exis- 
ten varias herramientas de evaluacibn que 
podrian ser utiles cn este sentido, pero ires ins- 
trumentos mcrcccn atcncibn especial: el 
Minnesota Importance Questionnaire', MIQ 
(Cuestionario Minnesota de Importancia), el 
Work Values Inventory (Invcnlario de valores 
laborales) y la Escala de Valores, que se revi- 
san en la siguiente seccibn. 

CUESTIONARIO MINNESOTA 
OE IMPORTANCIA 

El Minnesota Importance Questionnaire (MIQ) 
se desarrollb para medir las necesidadcs y va¬ 
lores vocacionales de adultos desde la educa- 
cion media en adelante. La prueba tiene una 
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srilida fundamentacion cn una leorfa de adapta- 
c jon laboral que cnfatiza la importancia dc la 
correspondence persona-ambicnte en la dctcr- 
[jiinacidn de la satisfaccibn que sc dcriva del 
trabajo (Dawis, England y Lofquisi, 1964; 
Dawis y Lofquisi, 1984; Lofquist y Dawis, 
|99l). Segun la teorfa, la satisfaccibn con el 
tiabajo sc relaciona direclamente con la corres¬ 
pondence entre las necesidades del (rabajador 
y las recompcnsas o rcforzadorcs disponibles 
cn el trabajo. Por cjemplo, cs probable que un 
fuluro cmplcado que tiene una fuerte necesi- 
dad de ayudar a olras personas, encuenlre sa- 
lisfaccibn cn un trabajo que le proporcionc 
amplias oportunidades dc scrvicio social; por 
el contrario, podrfa sentirse dcsdichado cn un 
puesto que enfatice el trabajo solitario. 

En su forma rods popular —que consislc 
de reactivos de pares dc comparacioncs— cl 
MIQ nude 20 necesidades organizadas en seis 
valores subyacentes relacionados con la satis¬ 
faccibn con el trabajo. La prueba tambidn sc 
presenta en un formato jerarquizado que no 
se analiza aquf. Los seis valores surgieron dc 
los anblisis factoriales de las necesidades. Los 
valores y sus necesidades componcnlcs sc listan 
en cl cuadro 12-2. Es importante enfatizar que 
cada “escala" de necesidad en realidad consis- 
te de una sola afirmacibn de necesidad. Por 
cjemplo, la “escala” de necesidad de Inde¬ 
pendence consiste en realidad de una sola afir¬ 
macibn que sc asemeja a la siguiente: “Me 
permitin'a tomar mis propias decisioncs”. 

El MIQ consiste de 210 reactivos. Estos 
incluyen 190 reactivos que aparean cada una de 
las 30 necesidades con todas las demas. Veintc 
reactivos adicionalcs rcquieren juicios absolu¬ 
tes sobre la importancia de cada dimensibn de 
necesidad. Los reactivos de pares de compara- 
ciones se reficrcn al “emplco ideal” de la perso¬ 
na evaluada y se asemejan a los siguientes: 

_Me darfa una sensacibn de logro, 

O 

_ Me permitin'a tomar mis propias 

decisioncs, 

Se instruye a la persona evaluada para que sc- 
leccione la altemativa de mayor importancia 


Cuadro 12-2. Valores y componentes 
del Cuestionario Minnesota 
de importancia 


Valores 

Componentes 

Aprovecha- 

Ulilizacibn de capacidad 

miento 

Aprovechamiento 

Comodidad 

Actividad 

Independencia 

Variedad 

Compensacion 

Seguridad 

Condiciones de Irabajo 

Estatus 

Avance 

Reconocimienlo 

Autoridad 

Altruismo 

Comparieros de trabajo 

Servicio social 

Sentimientos morales 

Seguridad 

Polfticas de la comparifa 
Supervision—Relaciones humanas 
Supervisibn—T bcnica 

Autonomfa 

Creatividad 

Responsabilidad 


personal cn un empleo —de aquf la referenda 
al termino Importancia en el tflulo del instru- 
mento. En el ejcmplo anterior, la necesidad de 
logro (Me darfa una sensacibn de logro) se equi- 
para con la necesidad dc rcsponsabilidad (Me 
permitin'a tomar mis propias dccisiones). A fin 
dc aparear cada necesidad con cada una de las 
otras, se requieren 190 reactivos.* Cada una 
de las 20 necesidades laboralcs lambidn se cla- 
sifican dc mancra individual en una escala ab- 
soluta de importancia, lo cual resulta cn un total 
dc 210 reactivos. Estos juicios absolutos per- 
milen Itts comparacioncs entre personas eva- 
luadas o entre escalas para un mismo individuo 
examinado. 

El MIQ se interpreta en referenda a patro- 
nes de reforzamientoocupacional (PRO) para 


• El numcro total de comparacioncs dc pares para N 
afirmacioncs (cuando cl orden no cs importante) puc- 
dc calcularsc a partir dc la fbrmula N(N -1 yi que es 
20(19V2o 190. 
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casi 200 ocupaciones. Los PRO se dcrivaron 
de un programa de investigacidn paralela que 
utilizd el Minnesota Job Description Ques¬ 
tionnaire, MJDQ (Cuestionario Minnesota de 
descripcidn de puestos), una escala que se pa- 
rece al MIQ. El MJDQ requiere que los actua- 
les titulares del puesto califiqucn la prescncia 
o auscncia percibida de reforzadores en un 
empleo dado. Por supuesto, dstos son simple- 
mente las 20 neccsidades laborales reformula- 
das cn tdrminos apropiados, de modo que captcn 
los requisitos ocupacionales. 

Mediante la comparacidn del perfil de nc- 
cesidades y valores de la persona evaluada con 
los patrones conocidos de reforzamiento para las 
ocupaciones representativas. los resultados del 
MIQ pueden utilizarsc para pronosticar la satis¬ 
faction en empleos especfficos. Esto se realiza 
por medio del Indice C o fndicc de correspon- 
dencia, que es el coeficiente de corrclacidn entre 
cl perfil del individuo en el MIQ y el PRO para 
cada ocupacidn. Se predicc satisfaccidn con una 
ocupacidn cuando la correlacidn supera al .SO. 

El formato de pares de comparaciones del 
MIQ permite que el examinador valore la con¬ 
sistency de las respuestas. Considdrense tres 
nccesidadcs cualesquiera, designadas como A. 
B y C. Supdngase que una persona evaluada 
prefiere A por encima de B y tambidn prefiere 
a B porcncima de C. En tdrminos logic os, esta 
persona tambidn preferiria A por cncima de C 
(transitividad). £stc es un cjcmplo de una Triada 
Ldgicamentc Consistente (TLC). La puntuacidn 
TLC es el porccnlaje de todas las triadas que 
son Idgicamente consistentcs. Esta calificacidn 
proporciona un fndice de la consistency de las 
respuestas, que es una medida de la validez de 
presentacidn de la prueba. Las puntuaciones 
TLC por debajo de 33 hacen surgir la sospccha 
de que la persona evaluada ha respondido de 
manera descuidada o alcatoria. En los estudios 
test-retest, entre mayor sea la puntuacidn TLC. 
mas cstablc serd cl perfil MIQ de la persona 
examinada. 

La confiabilidad del MIQ va de adccuada a 
excelente, dependiendo del intervalo para la re- 
pcticidn de la prueba. Se informa que la me- 
diana de la corrclacidn test-retest para las 20 


escalas es de .89 para una repeticidn inmediata 
de la prueba, pero de s6lo .53 cuando la repetj. 
cion de dsta es despuds de 10 meses. Las 
confiabilidades de consistencia interna sc co- 
locan por lo comun alrededor del .80 (Rounds 
y cols., 1981), 

Cerca de 200 estudios tratan sobrc la valj. 
dez del MIQ, de modo que es diffcil resumir 
las tendencias (Layton, 1992). Los resultados 
indican que las 20 escalas del MIQ discrimi- 
nan entre distintos grupos ocupacionales; las 
corrclaciones con cl Strong Vocational Interest 
Blank son significativas y consistentes con la 
teorfa; y el MIQ tiene corrclaciones apropiada- 
mente bajas con las capacidades como las mi- 
de la General Aptitude Test Battery (Baterfa de 
pruebas de aptitud general; Benson, 1985; 
Layton, 1992). En un estudio confirmatorio, las 
puntuaciones de Indcpendencia del MIQ pre- 
dijeron de manera moderada si los estudiantes 
de posgrado en orientacidn psicoldgica se vol- 
verfan cientfficos o practicantcs cuando ingre- 
saran al mcrcado laboral (Tinsley, Tinsley, 
Boone y Shim-Li, 1993). 

El MIQ es un instrumento muy respetado 
que merece utilizarse de manera extensa. Cu- 
riosamente, la prueba nunca ha captado en rca- 
lidad una atencion amplia. Quizes esto se debe 
al formato del instrumento, que podrfa consti- 
tuir un impedimento para que lo adopte el per¬ 
sonal de scrvicios humanos. El problema es que 
las personas evaluadas se enfrentan con las 
mismas afirmacioncs de necesidad una y otra 
vez. A fin de aparear cada una con todas las 
demds necesidades, es necesario utilizar cada 
afirmacidn individual en 19 reactivos separa- 
dos de la prueba. Los individuos examinados 
sienten que se encuentran con las mismas pre- 
guntas una y otra vez, aunque cada reactivo del 
MIQ es, de hecho, unico. Sin considerar su so- 
lidez psicomdtrica, desde el punto de vista de 
la persona evaluada, el MIQ es un instrumento 
poco agradablc. 

INVENTARIO DE VALORES LABORALES 

El Work Values Inventory. WV1 (Inventario de 
Valores Laborales). es un instrumento corto y 
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scncillodiscrtado para medir 15 valores labore¬ 
rs cn individuos dcsdc la secundaria hasta la 
preparatoria (Super, 1968, 1970). La prueba es 
e | producto final de decenios dc investigacidn 
acerca de las metas que motivan a los indivi¬ 
duos a irabajar. Los 15 valores laborales se iden- 
tjftcaron a travds de una revision de la literature 
que incluydel primer trabajo cldsico dc Sprunger 
(1928), sobre los Tlpos dc hombrcs. Los reac- 
ijvos, cscalas y formatos de la prueba se revisaron 
y se refinaron continuamentc hasta scleccionar 
el planteamiento actual de calificacidn de cin- 
co puntos (Super, 1970, 1973). 

El WV1 es un instrumento de autoinforme 
que consiste de 45 reactivos calificados en una 
eseala de cinco puntos desdc “Muy importan- 
te" hasta “Sin importancia". Los reactivos de 
la prueba se parecen a los siguientes: “Volver- 
se famoso en su campo". “Tomar sus propias 
decisioncs en el trabajo", “Sentir que ha ayuda- 
do a otras personas" y “Tener un jefe considc- 
rado”. Hay ires reactivos cn cada una de las 15 
cscalas. Los 15 valores laborales que mide la 
prueba incluyen los siguientes: 


Altruismo 

Estdtica 

Creatividad 

Estimulacion 

intelectual 

Logro 

Independcncia 

Prestigio 

Direeci6n 


Remuneracidn economica 

Seguridad 

Contomo 

Relacioncs de supcrvisi6n 

Colegas 
Modo de vida 
Variedad 


Estos valores laborales se dcscribcn en detalle 
cn el manual. Por ejemplo, Altruismo sc des¬ 
cribe como “presente cn un trabajo que le per- 
mite a uno contribuir al biencstar de los demds” 
y Prestigio se explica como “asociado con un 
trabajo que le proporciona a uno una posicidn 
a los ojos de los demds y evoca respeto". Por 
ciemplo, "Volverse valioso en su campo" per- 
tchecerfa a la eseala de Prestigio. 

Los resultados del WVI se presentan como 
IS puntuaciones naturales de eseala, cada una 
de las cuales va desdc 3 (calificacidn baja) has¬ 


ta 15 (responder con “Muy importantc" a los 
tres reactivos cn la eseala). Estas calificacioncs 
permiten tres estrategias de intcrpretacidn. En 
un analisis clfnico se destacan las tres califica- 
ciones mas altas con prop6sitos de discusidn 
por parte del orientador y de la persona evalua- 
da. Los datos tambiln pueden analizarse cn t6r- 
minos normativos con respecto a los resultados 
de otros cstudiantes de la misma edad. Mas im¬ 
portantc es cl hecho de que es posible predecir 
la satisfaccidn cn di versas ocupacioncs median- 
te el empleo de los palrones de reforzamiento 
ocupacional (PRO). El enfoque es similar al 
cnunciado anteriormente para el MIQ, en el que 
el orientador determina cl grado de cquipara- 
cidn entre los valores laborales dc la persona 
examinada y los reforzadores conocidos, dis- 
ponibles en diversas ocupaciones. 

Los aspectos tecnicos del WVI son enco- 
miables. En una mucstre de 99 estudiantes de 
bachillcrato, el instrumento rcveld confiabi- 
lidades test-retest a dos semanas en el rango 
de .80 para todas las cscalas cxccpto Prestigio 
(r = .76). El manual proporciona cuantiosos 
datos normativos para cstudiantes de secunda¬ 
ria y preparatoria. La validez tambiln parece 
robusta, como se juzga por las corrclaciones 
con otras medidas dc valores laborales, analisis 
factorial dc las escalas y reactivos, y relacioncs 
con criterios externos que confirman la teorfa. 
Bolton (1985) proporciona una cxcelente re- 
sena de la evidencia de validez para el WVI. 
Quizes el tinico comentario precautorio acerca 
dc dste es que el instrumento es, en la actuali- 
dad, un tanto obsoleto. Es necesario que se 
proporcioncn nuevas normas y datos sobre 
confiabilidad. 


ESCALA OE VALORES 

Un consorcio de investigadores bajo la direc- 
ci6n de Super y Nevill (1986) desarrolld la Es¬ 
eala de valores (VS) para evaluar 21 valores 
relacionados con los roles laborales y vitalcs. 
La prueba consiste de cinco reactivos por va¬ 
lor, calificado cada uno dcsdc 1 (“Dc poca o 
mnguna importancia”) hasta 4 (“Muy impor- 
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(ante"). Se utiliza un reactivo final cuando la 
escala se aplica de mancra (ransculturai, para 
un total dc 106 reactivos. Los valores que midc 
la VS incluycn los siguientes: 


Utilization de 
capacidad 
Logro 
Avance 
Estdtica 
Altruismo 
Autonomta 
Creatividad 
Rccompcnsas 
econ6micas 
Estilodc vida 


Desarrollo personal 

Actividad ffsica 

Prcstigio 

Riesgo 

Interaction social 
Vaiiedad 

Condicioncs laboralcs 
Identidad cultural 

Dcstreza ffsica 
Seguridad econdmica 


Un aspecto poco comun, pero sumamente de- 
scablc dc la VS cs que la prueba se desarrolld 
de mancra explfcita para utilizarsc en investi- 
gacidn transcultural. Un consorcio informal de 
cquipos dc invcstigacidn de docenas de pafses 
en America del Norte, Europa, Australia, Asia 
y Africa participd en la dcfinicuSn, revisidn y 
refinamicnto de los valores que mide la prue¬ 
ba. Cada equipo nacional la tradujo a su propio 
idioma y piloted los reactivos. 

La confiabiiidad dc la VS es mcramente 
adecuada, lo cual es comprensible dado que los 
instrumentos s6lo conliencn cinco reactivos por 
escala. Los cocficicntes alfa se encuentran 
por arriba de .70 en todas las esealas y las con- 
fiabilidadcs test-retest sc colocan arriba dc .50 
en muestras dc estudiantes universitarios. Sc 
proporcionan normas para una muestra apro- 
piada dc 3 000 estudiantes y adultos cstadouni- 
denses. Los cstudios iniciales dc validez parcccn 
prometedores, pero se requieren mas antes de 
que la prueba se emplce para orientaci6n indi¬ 
vidual (Rousseau, 1989; Slaney, 1989). 

La Escala dc valores representa los ideates 
mis elevados en el desarrollo dc pruebas. A1 
incluir la participacidn de cquipos de investi- 
gaci6n en todo cl mundo, Super y Nevill (1986) 
han concebido una prueba con verdadero atrac- 


livo y utilidad transculturales. Quiztf sus esfuer- 
zos ayudaran a foijar una perspectiva global 
sobre la naturalcza y valor del trabajo. Con dc- 
masiada frccuencia, el desarrollo dc pruebas ha 
sido una actividad territorial restringida a las 
culturas industrializadas de occidentc. Solo 
puede esperarse que otros autorcs de pruebas 
tambidn valoren la perspectiva transcultural en 
la cvaluacidn. 


EVALUACION DEL DESARROLLO 
PROFESIONAL 

Super (1957, 1990) ha enfatizado que la elec- 
ci6n de carrcra no cs una decisidn separada sino 
un proceso continuo. Este autor afirma que cl 
desarrollo profesional se caractcriza porctapas; 
crecimicnto, exploracidn, cstablecimicnto, 
mantenimiento y dcclinacidn. En la etapa dc 
crecimicnto, un individuo sc entretiene en fan¬ 
tasias, desarrolla interescs y descubrc sus ca- 
pacidades. Durante la etapa de exploracidn cn 
la adoicscencia y adultez temprana, cl indi¬ 
viduo participa cn un examcn tentalivo dc las 
carreras. A esto le sigue la estabilizacidn y con- 
solidacidn de una carrera cn la fase de establc- 
cimiento. Aproximadamcnte a la edad de 50 
anos. la mayorfa de los individuos enlra a la 
etapa de mantenimiento, la cual se caracteri- 
za por la innovacidn y actualization para 
algunos, pero por el estancamiento y la dcs- 
aceleracidn para otros. La etapa dc declination 
se caractcriza por la disgrcgacidn para la ma¬ 
yorfa dc las personas, pero para unas cuantas 
implica una especializacidn profesional. 

En las etapas iniciales del desarrollo profe- 
sional —las etapas de crecimiento y explora- 
ci6n— es posible que las pruebas vocacionales 
tradicionalcs no proporcionen los mejorcs ti- 
pos de informacidn para orientaci6n. dado que 
en general se basan cn la premisa de que la per¬ 
sona evaluada cstti bicn informada acerca del 
trabajo y tiene patrones de interns bien cstableci- 
dos. No obstante, es comun que los individuos 
cn estas etapas tengan informacidn linutado 
sobre las carreras y conocimientos mfnimos de 
sus inlereses y valores vocacionales. En talcs 
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situaciones, sc requicrc de instrumentos espe- 
cializados para una evaluacion vocacional 
eficaz. 

Varias medidas vocacionales se basan en el 
reconocimiento de que la eleccidn de carrera 
cs un proceso conlinuo en vez de una sola de¬ 
cision. Eslos instrumentos alternativos se en- 
focan en la madurez del conocimicnto sobre la 
canera, la planificacion vocacional y las habi- 
lidades en la toma de dccisiones. En el cuadro 
12-3 sc mencionan brcvcmente varias pruebas 
representatives acerca del desarrollo de carrera 
y la madurez vocacional. Para un analisis mas 
amplio, se insta al lector a consultar a Walsh y 
Betz (1995). 

Cuadro 12-3. Medidas representativas 
del desarrollo profesional 


Career Directions Inventory (Inventario de 
Orientacibn Profesional) 

(Jackson, 1986) 

Consiste de 100 triadas de afirmaciones que 
describen actividades relacionadas con el Irabajo 
y el examinando marca sus actividades mbs 
preleridas y menos preleridas. Las 15 escalas de 
inlereses basicos incluyen tanto roles laborales 
como eslilos de trabajo; p. ej.. administration, ser- 
vicios alimenticios, ventas, exteriores, literalura, 
asertividad, persuasion, sislematizacibn. Exce- 
lentes confiabilidad y validez; las normas se basan 
en 12 000 individuos de mbs de 150 especia- 
lidades educativas y ocupadonales. 

Escala de Decisiones Profesionales 
(Osipow, 1980) 

Inventario corto que consiste de 19 reactivos en 
los que la persona evaluada indica en una esca¬ 
la de 1 a 4, que tan estrechamente describe cada 
una de las alirmaciones su pensamiento acer¬ 
ca de las profesiones. Esta escala proporciona 
una medida de la Indecision sobre la carrera que 
es de particular utilidad en los esludios previos y 
posteriores a las intervenciones vocacionales. 

Career Beliefs Inventory (Inventario de Creen- 
cias sobre la ProfesiOn) 

(Krumboltz, 1991) 

Formado por 96 reactivos que se callfican en 
una escala de cinco puntos desde “fuertemenle 
de acuerdo" hasta luertemente en desacuerdo", 


Cuadro 12-3. Medidas representativas 
del desarrollo profesional 
(continuation) 


este inventario tiene el propOsito de identificar 
las creencias del cliente que pueden obslaculizar 
el logro de metas profesionales. Ejemplos de 
las 25 escalas incluyen: planes de carrera, 
aceptaciOn de la incertidumbre, satisfacciOn 
intrinseca, control, aprobaciOn de los dembs. 

Career Development Inventory (Inventario de 
Desarrollo Profesional) 

(Super, Thompson, Llndeman y otros, 1981) 
El CDI es una medida amplia del desarrollo y 
madurez profesional que consiste de cinco sub- 
pruebas: Planificacion de carrera, que mide el gra- 
do y participacion en bsta; Exploracidn de carrera, 
que valora los intentos actuates y futuros para 
obtener inlormacidn sobre la carrera; Toma de de¬ 
cisiones, que mide la capacidad para aplicar el 
conocimlento y discemimiento a la planificacibn 
de carrera; Informadon del mundo laboral, una 
medida del conocimiento acerca de la estructura 
ocupacional; y Conocimiento sobre el grupo ocu- 
pacional preferido, que proporciona una evalua- 
cion a profundidad del conocimiento acerca del 
grupo ocupacional preferido de la persona eva¬ 
luada. 


MOOELO INTEGRATOR 
M DE LA EVALUACI6N DE CARRERA 


Es poco comun que los profesionales de la eva- 
luacidn de carrera dependan de la informacidn 
de una sola fuente como un cstudio de intere- 
scs o valores laborales. El orientador vocacio¬ 
nal cficaz utiliza un modelo integrador en el 
que se considcra de manera simultbnea la in- 
formacibn de las dreas de intercses, capacidad 
y pcrsonalidad. Lowman (1991) ha presentado 
los elementos de este enfoque y gran parte del 
siguienle andlisis sc basa cn su andlisis. Los 
profesionales de este mbtodo no minimizan la 
importancia de los inlereses en la determina- 
cion de la eleccibn de carrera y la satisfaccibn 
con la misma. No obstante, tienden a asignar 
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una importancia primaria a los patrones de ca- 
pacidad y a cicrtas caracterfsticas de persona- 
lidad en la cvaluacidn y orientacidn vocacional. 
En primer tdrmino se analizan los patrones de 
capacidad. 

PATRONES DE CAPACIDAD 
EN LA EVALUACI6N DE CARRERA 

Dependiendo de las mctas vocacionales del 
clicnte, varias dimensiones dc capacidad po- 
dri'an scr pertincntcs para la evaluacidn de ca- 
rrera. Una lista parcial incluye capacidades 
ffsicas, andlisis espacial, intcligcncia verbal, 
capacidades dc invcstigacidn. capacidades ar- 
tfsticas c intcligcncia social (Gottfredson, 1986; 
Lowman, 1991). La importancia de las capaci- 
dades mentales amplias o primarias como el 
aniilisis espacial o la inteligencia verbal es bas- 
tante obvia. Por ejcmplo, la arquitectura requie- 
re dc niveles elevados dc andlisis espacial para 
lograr el dxito. En el caso de un futuro arqui- 
tccto, ninguna cantidad dc interns en el campo 
puede compcnsar una baja capacidad en and- 
lisis espacial. Dc la misma manera, las capa- 
cidadcs verbalcs son csenciales para el pc- 
riodismo y otras profcsiones que demandan 
dominio del lenguaje. La importancia de apti¬ 
tudes especializadas como las capacidades 
mecdnicas (para un futuro mecdnico) y las ca- 
pacidadcs artfsticas (para un futuro artista) es, 
de la misma manera, algo explfcito. Pero, £qud 
hay con respccto a la inteligencia social? ^Es 
pcrtincntc para la evaluacidn de carrera? i Sc 
puede mcdir la inteligencia social? 

Thorndike (1920b) fue cl primero en iden- 
tificar la inteligencia social, la cual se reftere a 
la capacidad para comprcnder a otras personas 
y rclacionarse de manera eficaz con ellas. Aun- 
que ha habido una controversia continua accr- 
ca dc la validcz del constructo de la inteligencia 
social, estudios recientes indican que pueden 
utilizarsc medidas sencillas dc Idpiz y papel para 
aislar csta dimension dc capacidad dc otros as- 
pectos dc la inteligencia (Lowman y Leeman. 
1988). Se revisardn dos estudios para ilustrar 
esta cuestion. 


Getter y Nowinski (1981) desarrollaron la 
Interpersonal Problem Solving Assessment 
Technique, IPSAT (Tdcnica de Evaluacidn para 
Soluci6n de Problemas Interpersonales), una 
prueba semiestructurada de respuesta libre acer- 
ca de la efcctividad interpersonal. En esta prue¬ 
ba se presenta a la persona evaluada una seric 
de 46 situaciones interpersonales problcmaticaj 
y se le pidc que sc imagine dentro de cada una 
dc ellas. Se instruyc a los examirundos a escri- 
bir maneras allcmativas de manejar cada situa- 
ci6n y se les pide que indiquen cudl de estas 
soluciones potencialcs elegirfan de hecho. Un 
ejemplo de una situacidn es como sigue; 

Tu jefe (o maestro) acaba de criticar una pane 
del trabajo que has realizado y consideras que la 
crftlca es Injustlticada e injusta ^Que harfas? 

Con base en un manual dctallado de califica- 
ciones, se califica cada una de las respuestas 
elegidas por la persona evaluada en una de cs- 
tas categorfas: Efectiva, Evitante, Inapropiada, 
Dcpendicnte e Incaliftcablc. Primero se calcu- 
la el numero total de respuestas para propor- 
cionar un fndicc dc la capacidad de la persona 
evaluada para pensar cn cursos altemativos de 
accidn. Despuds, se calcula el numero de solu¬ 
ciones elegidas calificadas dentro dc cada ca- 
tegorfa, lo cual proporciona un perfil dc los tipos 
de soluciones que preftere el individuo exa- 
minado. La confiabilidad intcrcalificadorcs de 
las subescalas de la IPSAT es bastantc alta y las 
correlaciones con otros instrumentos prestan un 
fuertc apoyo para la validcz convergente y dc 
discriminacidn de cste instrument). 

Un inventario mds reciente y prometedor 
de la inteligencia social es cl Social Relations 
Survey, SRS (Encucsta de Relaciones Socia- 
les), un instrument) con 128 reactivos dc falso- 
verdadero que desarrollaron Lorr, Youniss 
y Stefic (1991). Estos autores utilizan un md- 
todo de construccidn de escala rational que se 
sostiene en el andlisis factorial para producir 
un instrumento que midc ocho factores dc la 
inteligencia social. En el cuadro 12-4 se pre- 
sentan las subescalas y reactivos ilustrativos. 
Para los 49 participantcs que volvieron a exa- 
minarse dos semanas despuds, la confiabilidad 
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Cuadro 12-4. Escalas y reactivos 
ilustrativos de la Encuesta 
de relaciones sociales 


Asertividad social 

Me results facil hablar con otras personas a las 
que acabo de conocer. (V) 

Cuando conozco a nuevas personas, generalmen- 
le dejo que elijan el tema de la platica. (F) 

Directividad 

Estoy en mi mejor momento cuando soy la per¬ 
sona que lleva el control. (V) 

Me slento comodo cuando consiento en que otros 
tomen la direccidn de un grupo. (F) 

Defensa de derechos 

SI alguien rebasa mis limites, me deliendo. (V) 
Me incomoda regresar mercancfa a una lien- 
da. (F) 

Confianza 

Me siento confiado la mayor parte del tiempo. (V) 
Me siento insatisfecho de mis capacidades. (F) 

Aprobacion percibida 

Estoy seguro de que las personas que conozco 
piensan bien de mi. (V) 

En ocasiones tengo una sensacidn de desapro- 
bacion de las personas a mi alrededor. (F) 

Expresion de sentimientos positivos 

Mo agrada mostrar mis sentimientos positivos 
hacia los demds. (V) 

Me incomoda mostrar afecto por un amigo en 
publico. (F) 

Necesidad de aprobacion social 

Hago esfuerzos deliberados por voiverme popu¬ 
lar. (V) 

No me preocupa lo que otras personas digan de 
mi. (F) 

Empatia 

Me siento sumamente alectado cuando mis 
amigos me cuentan sus problemas. (V) 

En general conservo sentimientos objetivos e 
imparciales hacia los demas. (F) 

Fitonto: Basado en Lorr. M„ Youmss. R., y Slellc, E. (1991) An 
tnvenlory of social skills Journal ol Personality Assessment. 57. 
506-520 


test-retest mediana de las subescalas fue uii 
imprcsionante .89. Se proporcionan normas para 
260 mujeres univcrsitarias y 355 mujeres con 
cducacidn media. Varios enfoques para la vali- 
dez concurrent y de constructo indican que cl 
SRS proporciona un abordaje vdlido para la eva- 
luacidn de autoinformc de las habilidades so¬ 
ciales. 

Mds alld de (oda duda, la inteligencia social 
estd sumamente relacionada con la orientacidn 
dc carrera. Por ejemplo, una futura enfermera 
lequerira de altos nivcles de inteligencia social 
para funcionar de manera eficaz en ese pueslo. 
En contraste, un tdemeo dc computador&s pue- 
dc nccesitar muy pocas habilidades sociales 
para tener un desemperto superior cn el am- 
biente de trabajo. Lowman (1991) presenta 
una taxonomfa hipotdtica de la inteligencia so¬ 
cial para ilustrar su rclcvancia en la evaluacidn 
de carrera (cuadro 12-5). Aunque la medio idn dc 
la inteligencia social continua siendo un reto, 
los profesionales del drea harfan mal en ignorar 
este factor de capacidad cn la evaluacidn de 
carrera. 


PATRONES DE PERSONALIDAD EN LA 
EVALUACION DE CARRERA 

Varios patrones de personalidad tambidn son 
sumamente pertinentes para la evaluacidn de 
carrera. Las pruebas dc personalidad se anali- 
zan cn detalle en capitulos posteriores, por lo 
cual sdlo se mencionardn aqui unas cuantas di- 
mensiones dc personalidad laboralmente perti¬ 
nentes. 

• La necesidad de logro es importante para las 
personas con aspiraciones en profesiones de 
negocios y de direccidn (p. cj., Orpen, 1983). 

• La ascendencia o dominio tambien es impor¬ 
tante para la jerarqufa de direccidn (p. ej., 
Bentz, 1985). 

• La estabilidad emocional predice el desem- 
peno positivo cn una amplia gama de traba- 
jos tradicionales, mientras que cl ncurolicismo 
se asocia con cl dxito en algunas profesiones 
artisticas (p. ej., Wills, 1984). 
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Cuadro 12—5. Taxonomia hipotetica de las demandas sociales de los puestos 


Grado de participacion 
social 

Dimensiones sociales del puesto 

Muy alto 

Roles terapduticos, educativos o administrativos, como gerento comercial 

enfermera o psicoterapeuta; alto grado de interaccidn social. 

Atto 

El contacto social no siempre es primario; p. ej., prolesor universilario, investi- 
gador en ciencias sociales; grado moderado de Interaccidn social. 

Moderado 

Interaccidn social minima, pero se necesila tacilitacidn social; p. ej., ejeculivo 
de alto nivel. 

Leve 

Interaccidn social minima y poca necesidad do preocupacidn acerca de los 
sentimientos y reacciones de los demas; p. ej., cajero en una tienda de des- 
cuento por departamentos. 

Bajo 

Interaccidn muy limitada con personas y no se requiere de roles terapduticos 
o de inlluencia; p. ej., cientifico en un laboratorio o novelists. 

Muy bajo 

No se necesitan habilidades sociales; el ambiente laboral puede ser solilario, 
como programador de compuladoras. 


Fuonlo: Basado en Lawman. R. L (1991) The clinical practice ot career assessment: Interests, abilities and personality Washlnalon 

DC: American Psychological Association w ’ 


• La masculinidad y la fcminidad dificren 
significati vamentc cntre di versos grupos ocu- 
pacionales (p. ej., Gough, 1987). 

La investigacidn sobrc la relcvancia dc las di- 
mensioncs de pcrsonalidad para la cvaluacidn 
de carrcra aun sc encuentra cn pahales. Sin em¬ 
bargo, las tcndcncias preliminarcs como aque- 
llas quc se senalan anteriormentc dcmucstran 


RESUMEN 


1. El proposito de los invcntarios de intereses 
cons isle en idcntificar los intereses voca- 
cionalcs de la persona y otros relacionados 
para facilitar las eleccioncs dc carrera. Una 
buena adccuacidn entre los intereses per¬ 
sonates y los patrones idcntificados de in¬ 
terns dc una ocupacidn promucve el dxito 
en una elecci6n profesional y la satisfac- 
ci6n con la misma. 

2. El Strong Interest Inventory (SII) es la ulti¬ 
ma revisidn del Strong Vocational Interest 
Blank (S VIB), que aparccid por primera vcz 
en 1927. Como su predecesor, cl SII utiliza 


dc manera clara la relcvancia de las variables de 
personalidad para cl dxito cn cl trabajo. Se acon- 
seja a los profesionalcs quc considcrcn dentro 
dc la evaluacidn dc carrcra las dimcnsioncs dc 
personalidad relacionadas ocupacionalmcnte. 
En resumcn, la evaluacidn de carrera cs una 
empresa multilacctica quc debe tomaren cucn- 
ta no s6lo los intereses, sino tambidn los patro¬ 
nes de capacidad y los rasgos de pcrsonalidad. 


codificaciones empfricas para las ocupa- 
ciones. 

3. Los coeficientes de estabilidad a corto pla- 
zo de las 211 esealas ocupacionalcs del SII 
sc encucntran por lo general cn el rango de 
.90. La validcz de la prueba sc ha visto re- 
forzada por la adecuacidn gcneralmcnte 
buena cntre el perfil ocupacional inicial y 
la ocupacidn que en un momento dado se 
practice. 

4. El Jackson Vocational Interest Survey 
(JVIS) utiliza un Formato dc rcaclivos de 
opcirin multiple para reducir el impacto 
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dc la dcscabilidad social. La derivation de 
las 34 escalas bAsicas de interns fue ratio¬ 
nal y guiada por la tcorfa. Las escalas son 
razonablcmcnte independientes enlrc sf y 
poseen coeficientes de cstabilidad a corto 
plazo que sc colocan a mitad del rango de 
.80. Los csludios de validez son promete- 
dores. 

5. Los 168 rcactivos del Kuder General 
Interest Survey (KGIS), que se utilizan con 
adolescentes cn bachillcralo, producen 10 
calificaciones de intcrcscs gcncrales. Los 
usuarios dcben ser cautos en no intcrpretar 
cn exccso las puntuaciones del Kuder: cl 
cocficienle medio dc cstabilidad a cuatro 
anos para las escalas cs de sdlo .50. 

6. HI VPI de 160 reaclivos es un invcntario 
objctivo, de Itipiz y papcl, acerca de in- 
tcrescs y pcrsonalidad que cvalua II di- 
mcnsiones, incluyendo los scis tcmas de 
personalidad-ambicnte denominados Rca- 
lista, Investigador, Artfstico, Social, Em- 
prcndcdor y Convencional (RIASEC). 

7. La confiabilidad del VPI cs muy buena, con 
confiabilidadcs test-retest por cscala que se 
encucntran cn gran mcdida en el rango dc 
.90. La validez de la prucba recibe apoyo 
dc una conclusion clave cn cuanto a que 
los individuos ticndcn a dirigirsc a ambien- 
tes que son congrucntes con sus tipos dc 
personalidad; por ejcmplo, los estudiantcs 
ticndcn a seleccionar e ingrcsar a cspeciali- 
dadcs universitarias que coincidcn con sus 
claves en cl VPI. 

8. I .a Busqucda Independicntc es una prueba 
dc intcreses vocacionales que aplica e in- 
terpreta el propio individuo evaluado; sc 
basa en el modelo RIASEC; cada tema de 
estc modelo caracteriza no s6lo a un tipo 
de persona sino tambicn al tipo de ambien- 
tc de trabajo que dicha persona cncucntra 
mas compatible. 

9. Una medida miSs novedosa dc autoinforme 
dc las habilidadcs c intereses es la CISS. 
La prucba consiste de 200 rcactivos de in- 
tereses y 120 reaclivos de habilidadcs que 
sc califican en una escala de scis puntos. 


Lit prueba produce puntuaciones T en nu- 
merosas escalas que incluyen las siete 
Escalas de oricntaciOn: Influencin, Organi- 
zacidn, Ayuda, CrcaciOn, Aniilisis, Produc- 
ci6n y Aventura. 

10. lot CISS tambiOn proporciona medidas in¬ 
dependientes de intereses y habilidadcs para 
29 Escalas bdsicas y 58 Escalas ocupacio- 
nales. La confiabilidad de las escalas del 
CISS es exccpcionalmcntc fuertc. Los da- 
(os iniciales sobre validez que presentan los 
autorcs de la prueba son muy prometedo- 
res, como por ejcmplo el hecho dc que las 
escalas sf discriminan entre ocupaciones de 
una mancra eficaz y significativa. 

11. Los valores laboralcs se refieren a las ncce- 
sidadcs, motivos y valores que influyen cn 
la cleccidn vocational, la satisfaction con 
cl trabajo y el dcsarrollo profcsional. Una 
adecuacidn entre valores laboralcs y elec- 
cion de carrera es importante para la satis¬ 
faction con cl trabajo. 

12. Una medida util dc los valores laboralcs es 
cl Minnesota Importance Questionnaire 
(MIQ). Una versiOn dc la prucba consiste 
de reaclivos dc pares de comparacioncs 
(p. ej., Me darfa una scnsaciOn de logro 
contra Me permitirfa lomar mis propias deci- 
sioncs), los cuales evaluan 20 ncccsidadcs 
organizadas en seis valores subyacentcs rcla- 
cionados con la satisfaccidn con el trabajo. 

13. El WVI de Super cucnla con 45 reaclivos y 
es un instrumento corto discOndo para mc- 
dir 15 valores laborales en estudiantcs dc 
secundaria y preparatoria. La confiabilidad 
y validez del instrumento son bucnas.Como 
en el MIQ, el WVI sc interpreta cn rclaciOn 
con los patrones dc neforzamiento ocupa- 
cional. 

14. La Escala de valores (VS) es un inslrumcn- 
to dcrivado dc manera transcultural que se 
disefi6 para evaluar 21 valores rclaciona- 
dos con los roles laborales y vitales. La pruc¬ 
ba consiste de cinco rcactivos por valor, los 
cuales sc califican en una escala dc cuatro 
puntos. Dado que cs principalmente un ins¬ 
trumento para investigaciOn, las aplicacio- 
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nes para orientacidn individual dcbcn abor- 
darse con precaucidn. 

15. Para algunas personas, la eleccidn de ca- 
rrera no es una decisi6n separada, sino un 
proccso continuo. Super cstablece cinco 
etapas del desarrollo profesional: creci- 
miento, exploracidn, establecimiento, man- 
tenimienlo y declination. En las etapas de 
crecimiento y cxploracidn. los instrumen- 


tos especializados son utiles para la evalua- 
cidn vocacional cficaz. 

16. Lowman ha propuesto un modelo integrador 
de la evaluacidn de carrera que incluye la 
consideracidn simultdnea de las Areas de 
intereses, capacidades y personalidad. Los 
patrones de capacidad, incluyendo la intc- 
iigcncia social, pueden ser muy importan- 
tes en algunas vocaciones. 


TERMINOS Y CONCEPTOS CLAVE 


Modelo RIASEC 

p. 535 

Modelo integrador 

p. 549 

Valores laboralcs 

p. 544 

Inteligencia social 

p. 550 

Patrones de reforzamiento 




ocupacional 

p. 545 







Tema 12B 

Valores en el desarrollo moral, 
espiritual y religioso 


Evaluacion de los valores vitales 
Evaluacion del juicio moral 
Evaluacidn de conceptos espirituales y religiosos 
Resumen 

TOrminos y conceptos clave 



En los medios populares de informacidn 
se encuentran referencias frecuentes a los va¬ 
lores y a los cambios en dichos valores a nivel 
individual y nacional. Los polfticos condenan 
la decadencia de los valores familiares. los 
editorcs de revistas denuncian la ausencia del 
altruismo voluntario y los columnistas censu- 
ran el rcsurgimiento del materialismo y la am- 
bicidn. lx>s Ifderes religiosos tambidn saltan a 
la palestra. Como antfdoto para el cinismo glo¬ 
bal, demandan un retomo de los valores espiri- 
tualcs que afirman el significadode la vida. Casi 
todo el mundo tiene una opinion acerca de los 


valores —en especial con respecto a aqudllos 
de otras personas o grupos. 

Pcro ^qud son los valores y cdmo se les pue- 
de medir? Aunquc existe una gran cantidad de 
litcratura acerca de la naturaleza y definicidn 
de los valores, sorprendc la poca investiga- 
cidn empfrica sobrc su medicidn. En general, los 
psicdlogos definen al valor como una creencia 
compurtida y duradera acerca dc los modos 
ideales de conducta o estados meta de la cxis- 
lencia (Rokeach, 1980). Los valores persuaden 
a la accidn, moldean actitudes y guian los es- 
fuerzos para influir a los demds. Los valores 
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tambidn surgen en respuesta a condiciones 
sociales y, por tanto, ticncn cierto grado dc 
malcabilidad (Ball-Rokcach, Rokcach y Cjrubc, 
1984). 

En eslc tema sc unalizarin los aspectos cla¬ 
ve y las pruebas imporlantcs quc se rclacionan 
con la cvaluacidn dc los valorcs personates, 
ampliamenic definidos. Sc comicnza con una 
erftica de los instrumentos gencrales que eva- 
luan valores vitales —los fines o mclas socia- 
les quc se considcra deseable alcanzar. Despuds 
el capitulo reseda los enfoques de evaluacidn 
en los dominios moral, espiritual y rcligioso. 
Esto incluye una amplia cobcrtura del mdtodo 
clasico de Kohlbcrg (1981, 1984) para la medi- 
cidn del razonamiento moral. Sc cierra con una 
breve revisidn dc la litcratura no cxplorada accr- 
ca de la medicidn dc conccplos espiritualcs y 
religiosos. 

a EVALUACION DE LOS VALORES 
VITALES 


Los valores son importantes porque proporcionan 
un esquema genernlizado para los actos y juicios 
personates. Cuando sc conoccn los valorcs vita- 
les dc un individuo, pueden predecirse conduc- 
tas tfpicas y conjeturar las probables actitudcs. 
En un trabajo clasico sobre el tema, Rokcach 
(1968) subraya la importancia dc los valores: 

Dedr que una persona liene un valor* es igual a 
dedr que tlene una creenda persistente de que 
un rnodo especiflco do conducta o estado meta 
de la existcncia es prelerible en lerminos perso¬ 
nates y sodalos a las altemativas en cuanto a 
modes de conducta o estados meta de la exis¬ 
tence. Una vez que un valor se ha inlernallzado. 
se vuelve, a nivel conscienle o inconscienle. una 
norma o crilerio para guiar los actos. para desa- 
rrollar o conservar aclitudes hacia objetos y si- 
tuaciones relacionadas, para juslilicar los actos 
y aclitudes proplos y de otras personas, para 
emilir un juicio moral sobre uno mismo o los de- 
mas, y para compararse uno mismo con olros. 

Por ultimo, un valor es una norma que se em- 
plea para influir en los valores, aclitudes y actos 
de, cuando menos, algunas otras personas 
—por ejemplo, nuestros hijos (pp. 159-160). 


Kluckhohn (1951) y Smith (1963) tanibien han 
propucslo eslc punto de vista acerca dc que los 
valores son. en cierto sentido, primarios y 
formativos. 

Es mis fiicil definir los valores quc medirlos. 
Unas cuantas esealas de valores han soportado 
la prueba del tiempo. En estc capitulo se revi- 
san tres instrumentos: cl Estudio dc valorcs cs 
una prueba intcrcsantc que tiene principalmen- 
te importancia histdrica; el Rokeach Value 
Survey (Encuesta de Valores de Rokcach) es una 
herramienta muy respetada para investigaci6n; 
cl Invcntario dc valorcs proporciona una ilus- 
tracidn que insta a la cautela acerca dc como, 
en ocasiones, las malas pruebas logran llcgar a 
publicacidn. 

ESTUDIO DE VALORES 

Los psicdlogos se han interesado cn la evalua- 
ci6n dc las valorcs personates desdc inicios dc 
estc siglo. No obstante, ha sido solo cn los ultimas 
30 ados quc sc han dcsarrollado medidas dc 
autoinformc dc los valorcs que son sdlidas cn tdr- 
tninos psicomdtricos. Uno dc los primeros ins¬ 
trumentos dc cste cstilo fuc el Estudio dc valorcs 
(SOV), un invcntario disenado para medirseis 
aclitudes bisicas de valoracidn: Tedricas (T), 
Econdmicas (E), Esteticas (Et), Sociales (S), 
Polflicas (P) y Religiosas (R) (Allport y Vernon, 
1931; Allport. Vernon y Lindzcy, 1960). Estos scis 
valorcs se basaron directamente en los Types of 
Men dc Spranger (1928). En este influyente li- 
bro, el intclcctual alcman Eduard Spranger afir- 
maba que la mayoria dc las personas presentan 
uno dc los siguientes valores como el mils do- 
minantc que define su personalidad: 

• Teorico (T): cl intends dominante de la perso¬ 
na tedrica es el descubrimicnto de la verdad. 

• Kcondmico (E): la persona econdmica se in- 
teresa de mancra primordial en aqucllo que 
es util. 

• Estctico (Et): la persona cstdtica le da el ma¬ 
yor valor a la forma y armom'a. 

• Social (S): el amor por la gente cs cl valor 
mis elevado para la persona social. 
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• Politico (P): la persona polftica sc interesa 
principalmentc por cl poder. 

• Rcligioso (R): la persona rcligiosa le asigna 
el mayor valor a la unidad mfstica con el uni- 
verso. 

La escala SOV consistc dc 30 preguntas que 
contraponcn un valor con otro, adcmas de olras 
15 preguntas que rcquicrcn de la clasificacidn 
dc los valores. Ejcmplos dc las preguntas in- 
cluyen los siguientes: 

• Cuando visita un templo, £sc sientc mds im- 
presionado por una sensacidn gcncrali/.ada 
dc reverencia y vencraci6n o por las caractc- 
risticas arquitectdnicas y los emplomados? 
(Religioso contra Estdtico). 

• En su opinion, ^se ha avanzado mds cn el pro- 
greso general debido a la libcracidn dc los 
esclavos, junto con el incremento en el valor 
que sc le da a la vida individual, o debido al 
descubrimiento de la maquinaria dc vapor, 
con la consccucntc industrializacidn y riva- 
lidad ccondmica de los pafses de Europa y 
America? (Social contra Econdmico). 

A paiiir de las respuestas a las preguntas dc 
opcidn for/osa y dc la clasificacidn dc los va¬ 
lores, se traza un perfil dc valores dc mancra 
ipsativa, nepresentando las fortalezas rclativas 
dc los scis valores para cada individuo. 

Lubinski, Schmidt y Bcnbow (1996) de- 
mostraron el mdrito del examen dc los valores 
con cl SOV en un estudio de seguimiento a 20 
anos con 203 adolescences intelectualmente 
talentosos. Se evalud inicialmcntc a la muestra 
de individuos dotados cuando tenian 13 anos dc 
edad y despuds dc nuevo en la adultez, a la edad 
de 33 ados. En general, los seis temas revela- 
ron estabilidad significativa a lo largo dc cstc 
periodo, con correlaciones medias interin- 
dividualcs dc .37 para diversos temas. Eslo es 
notable, dado que se supone que los ados dc la 
adolescencia y adultez joven son un periodo de 
confusidn y cambio, en especial cn cuanto a 
valores personates, a medida que las personas 
jdvencs se esfuerzan por encontrar una identi- 
dad. Las diferencias por sexo fueron notables: 


Los varoncs tcndicron a virar hacia un perfil T- 
E-P cn la adultez, micnlras que las mujeres ten- 
dieron a virar a un perfil Et-S-R. Aun asf, sc 
observd un patrdn comun en todos los partici- 
pantes, cn el que los valores Estdticos y Econd- 
micos adquirieron mayor promincncia en la 
adultez joven y los valores Polfticos y Sociales 
revelaron menor dominio. 

El Estudio dc valores ha provocado con¬ 
siderable discusidn como una herramienta 
de demostracion en cl salon de clases dentro dc 
cursos de psicologia, pero en otros sentidos no 
ha sido una prueba importantc. Unodc los prin- 
cipalcs problcmas con cl instrumenlo es que los 
seis valores se definen de manera vaga y dema- 
siado general como para tener un uso practico. 
No obstante, la prueba inspird a otros autores a 
dcsarrollar enfoques mds complcjos y amplios 
de la evaluacion dc los valores. Uno dc aque- 
llos que reconocieron tener una deuda con 
Allport y cl Estudio dc Valores fuc Milton 
Rokeach. 


ENCUESTA DE VALORES DE ROKEACH 

Rokcach (1973) definid dos tipos dc valores, 
instrumcntalcs y terminales. Los primeros son 
modos dcscables de conductn, mientras los se- 
gundos son estados meta deseablcs dc la exis- 
tencia. Por ejemplo, la ambicidn es un valor 
instrumental, y la seguridad familiar es un va¬ 
lor terminal. Para cl disefio dc la Rokcach Value 
Survey (Encuesta dc Valores de Rokcach), se 
obtuvo una lista final de 18 valores instrumen- 
tales al condensar 555 nombres de “rasgos de 
personalidad” en sindnimos aproximados. La 
lista final de 18 valores terminales se obtuvo 
de un examen de la litcratura y de otros enfo¬ 
ques subjetivos, impresionistas. Los 36 valores 
sc listan cn el cuadro 12-6. 

Aunque los valores individuates no se defi¬ 
nen cn dctalle, cada uno se acompana de una 
frase corta o dc sindnimos para aclarar el 
reactivo a las personas evaluadas. Por ejemplo, 
cl primero dc los valotcs terminales se presen- 
ta como sigue: "UNA VIDA C6MODA” (una 
vida prdspera), Llenarel estudio cs sumamente 
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Cuadro 12-6. Los 36 constructos de 
valor de la Encuesta de Valores 
de Rokeach, Forma D 


Valores terminales 


Una vida cbmoda 

Armonia interna 

Una vida emocionante 

Amor maduro 

Sensacibn de logro 

Seguridad nacional 

Un mundo en paz 

Placer 

Un mundo de belleza 

Salvacibn 

Igualdad 

Respeto hacia uno mismo 

Seguridad familiar 

Reconocimiento social 

Libertad 

Verdadera amistad 

Felicidad 

Sabiduria 

Valores instrumentales 

Ambicioso 

Imaginative 

Tolerante 

Independiente 

Capaz 

Intelectual 

Alegre 

Logico 

Limpio 

Amante 

Valiente 

Obediente 

Indulgente 

Cortbs 

Servicial 

Responsable 

Honrado 

Autocontrolado 


sencillo. A las personas que responden la prue- 
ba se les pide que clasifiquen por separado los 
18 valores terminales y 18 valores instnimentales 
con base en “su importancia para usted, como 
principios gufa cn su vida”. Los valores cstbn 
impresos en etiquetas adhesivas (para la Forma 
D). Los individuos simplemente desprenden 
las etiquetas y las clasifican en orden de im¬ 
portancia, retirandolas y volvibndolas a colo- 
car segun sea necesario. La catcgorfa para cada 
reactivo se vuelve la calificacibn para ese va¬ 
lor. No se permiten empales, de tnodo que las 
calificaciones de valor irdn de 1 a 18, donde 
las puntuaciones mbs bajas indican mayor im¬ 
portancia. 

La confiabilidad del Estudio de valores 
puedc enfocarse de dos mancras. La primera es la 
estabilidad temporal de las clasificaciones para 


las personas individuales. Para este enfoque, la 
escala se aplica en dos ocasiones y se correla- 
cionan los dos conjuntos de clasificaciones para 
cada indi viduo. Al emplcar este enfoque con cua- 
tro grupos de estudiantes universitarios (inter- 
valos de repcticibn de prueba de tres semanas a 
cuatro niescs), Rokeach (1973) informb corne- 
lactones medianas test-retest que iban de .76 a 
.80 para los valores terminales, y de .65 a .72 
para los valores instrumentales. La segunda 
manera de examinar la confiabilidad consiste 
cn calcular por separado la confiabilidad test- 
retest de las calificaciones individuals de va¬ 
lor, entre todas las personas evaluadas. Con este 
enfoque, la confiabilidad de las escalas indivi¬ 
duates es menor, aproximadamente de .65 para 
los valores terminales y de .56 para los valores 
instrumentales (Rokeach, 1973). Estas 
confiabilidades son bastante bajas en compara- 
cibn con instrumentos que ticncn mbs rcactivos 
por escala —lo cual no es sorprendente. Des¬ 
puds de todo, las “escalas" del Estudio de valores 
consislen cada una de un solo reactivo. Sin embar¬ 
go, con confiabilidades asi de bajas. el Estudio 
de valores deberfa utilizarse s6lo con propbsi- 
tos de invcstigacibn como la descripcibn o com- 
paracibn de valores grupales. La intcrprclacibn 
con propbsitos de orientacibn no tiene base. 

En un fascinantc ejcmplo de su aplicacibn 
en investigacibn, Rokeach y sus colaboradores 
utilizaron el Estudio de valores para medir los 
efectos de ver un solo programa de televisibn 
con duracibn de 30 minutos sobre los valores, 
actitudes y conductas (Ball-Rokcach, Rokeach 
y Grube, 1984). El programa de televisibn, pre- 
sentado por Ed Asncr y que se I lamb "Tlte Great 
American Values Test", se disefib de manera 
particular para influir en las calificaciones de los 
espectadores acerca de la importancia de valores 
terminales como libertad e igualdad. Por ejem- 
plo. acerca de una presentacibn grbfica cn pan- 
talla, la cual indicaba que los estadounidenses 
habfan clasificado a la libertad cn lercer lugar 
y a la igualdad cn doceavo. en promedio, entre 
los 18 valores terminates, Asner comentb: 

Los estadounidenses sienten que la libertad es 
muy important© La clasifican en tercer lugar. Pero 
tambien sienten que la igualdad es consldera- 
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blemente menos importante ... la clasifican en 
doceavo lugar. Dado qua la rnayorla de los es- 
ladounldenses valoran mucho mis a la llberlad 
que a la Igualdad. la pregunta sen'a: £qu6 qulere 
declr eso? ^Esto suglere que los estadouniden- 
ses en general ostan mucho mas Interesados en 
su propia libertad que en la de otras personas? 
iExiste una contradiccidn dentro del pueblo do 
Estados Unldos ontro su amor a la libertad y su 
manor amor hacia la Igualdad? 

Al comparer sus valores con estos results- 
dos, usted deberia poder decidir por si mismo si 
esta de acuerdo con los sentimientos del esta- 
dounidense promedio acerca de la libertad y la 
igualdad (Ball-Rokeach y cols., 1984). 

Un andlisis complete) de este estudio implicarfa 
una extensa dcsviacidn con rcspecto al tema de 
las pruebas psicoldgicas. No obstante, es posi- 
ble que el lector aprecic un rdpido rcsumcn. 
Los autores utilizaron un diseno de preprueba 
y posprueba sumamente controlado con ciuda- 
des experimentales y control para determinar 
los efcctos de ver cl programs. Para los espec- 
ladoresque vieron el programs sin interrupcidn, 
las clasificaciones medias para igualdad fuc- 
ron de 11.0 a 9.3, mientras que en el caso de los 
no espectadores, las clasificaciones para este 
valor fueron bastante estables. Varias otras ve- 
rificacioncs experimentales (p. ej.. solicitar 
donacioncs para proporcionar oportunidades 
culturales a mhos afroestadounidcnscs) tambidn 
confirmaron un cambio real en valores. Este 
estudio es un buen ejemplo del tipo de investi- 
gacidn social para cl que el Estudio de valores 
es muy adecuado. 

LIMITACIONES DE LA ENCUESTA 
DE VALORES DE ROKEACH 

Ya sc ha mencionado que las escalas indi vidua- 
les del Estudio de valores posccn confiabilidad 
marginal —lo cual signifies que cl instrumento 
nodeberfa utilizarse para oricntacidn individual. 
Varias otras limitaciones se derivan de la natu- 
raleza ipsativa de la prueba. El lector recordard 
que una prueba ipsativa es aquella en la que el 
promedio de las escalas siempre es cl mismo 
para todas las personas evaluadas. En particu- 
lar, el rango promedio para los 18 valores ins- 


trumcntalcs siempre serd de 9.5 y lo mismo 
ocurre con los valores terminales. Por defini- 
cion. cuando un individuo evaluado 1c da ma¬ 
yor clasificacidn a algunas escalas, otras deben 
recibir una clasificacidn baja. En este proceso 
se pierde cualquier medida absoluta del valor 
para ese individuo. Supdngase, por ejemplo, que 
se puede medir la fortaleza absoluta de los 18 
valores instrumentales en una escalade I a 100 
(nota: esto no es posible con el Estudio de va¬ 
lores). Considdrese el caso donde un individuo 
A ticnc una fortaleza absoluta de 99 para ambi- 
cioso y de 98 para obediente, con todos los dc- 
mfis valores por debajo de 90; mientras que un 
individuo B ticnc una fortaleza absoluta de 39 
para ambicioso y de 19 para obediente, con to- 
dos los demits valores por debajo de 10. Casi con 
toda seguridad, el individuo A valorarfa la ambi- 
cidn y la obediencia en grado elevado, mientras 
que cl individuo B le da un valor modesto a la 
ambicidn y devalua la obediencia. De hecho, al 
individuo B sc le podrfa caractcrizarconio pnfc- 
ticamente carentc dc valores. No obstante, ambas 
personas recibirfan valores de 1 para ambicio¬ 
so y 2 para obediente. El Estudio dc valores no 
es sensible a las difcrcncias dc magnitud den¬ 
tro de personas individuales y tampoco capta 
diferencias de grado entre individuos. 

Braithwaite y Law (1985) llaman la aten- 
ci6n hacia debilidades adicionales del Estudio 
de valores. Sehalan que el inventario omite va- 
rios valores importantes, incluyendo biencstar 
ffsico, derechos individuates, frugalidad y 
despreocupacidn. Quizas es mils importante su 
crftica acerca de que la prueba Rokeach depen- 
de de un solo reach vo para cada valor, en vez de 
utilizar Indices con reactivos multiples para los 
constructos de valor. Estos autores proponen 
un instrumento alternativo (basado en cl enfo- 
que de Rokeach) que supucstamenie engloba 
cualidades psicometricas mejoradas para la 
medicidn de los valores personales. 


INVENTARIO DE VALORES 

El Inventario de valores se disend para evaluar 
seis valores en gerentes profesionales: teorico. 
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de poder, dc logro, humano. industrial y finan¬ 
cier!). HI instrumento consistc de 28 conjuntos 
de tres citas semejantes a las siguientes: 

• La menor brizna de verdad representa el amar- 
go esfuerzo y desventura de algun hombre. 

• Nunca hacemos nada bien si pensamos en la 
mancra de haccrlo. 

• Todo trabajo es noble y sdlo cl trabajo es noble. 

La persona cvaluada indica su grado dc acuer- 
do con cada afirmacidn. Sc distribuyen Ires 
puntos entre cada conjunto de ires citas: un 
punto para cada una si todas se refrendan por 
igual, tres puntos para una de el las si es la uni- 
ca que se refrenda y asf sucesivamcntc. Como 
podrd haber adivinado el lector, cada afirma- 
cidn representa un valor espectfico. Al sumar 
cl numero dc puntos que sc conccden a cada 
uno de los seis valores entre los 28 conjuntos 
de reactivos, sc obtiene un perfil dc califica- 
cioncs dc valor. 

Los revisorcs sc han mostrado mordaces 
en sus crfticas para el Invcntario dc valores, 
senalando que la prueba carecc dc una funda- 
mentacion tcdrica y ni siquiera posce validez 
nominal, no se diga validez tdcnica (Muchinsky, 
1985; Tziner, 1985). No se menciona al instru¬ 
mento como algun lipo dc actitud ruin, sino sim- 
plemente para ilustrar que, en ocasioncs, las 
pruebas cucstionables llegan a publicarsc. Los 
usuarios de las pruebas deben cjercitar su jui- 
cio antes de adoptar nuevos instrumentos. 


EVALUACION DEL JUICIO MORAL 


ESCALA DE JUICIO MORAL 

Kohlberg ha propueslo una de las pocas teorfas 
del dcsarrollo moral que es completa y se basa 
en un fundamento empi'rico (Colby, Kohlberg, 
Gibbs y Lieberman, 1983; Kohlberg, 1958, 
1981,1984; Kohlberg y Kramer, 1969). Aunque 
se ocup6 mds dc los problemas del dcsarrollo 
moral basados en la teoria que dc los malices 
de la medicidn cstandarizada, Kohlberg genera 


un mdtodo dc evaluaci6n que se utiliza dc nia- 
nera amplia y que sc ha discutido intensamen- 
te. Se revisara la fundamentacidn subyaccnte 
para su herramienta de medici6n y tambien se 
analizardn las propiedadcs psicomctricas del 
instrumento. Ademds, sc examinard de mancra 
breve una adaptacidn mds objetiva del enfoque 
de Kohlberg, la cual sc conoce como Defining 
Issues Test (Prueba de cuesliones determinantes) 
(Rest, 1979; Rest y Thoma, 1985). 

ETAPAS DEL DESARROLLO MORAL 

La teorfa de Kohlberg parti6 de la teorfa dc 
Piaget (1932) acerca de los estadios del desa- 
rrollo moral en la infancia. Este autor extendid 
las ctapas hasta la adolcsccncia y adultcz. A fin 
de explorar cl razonamiento sobre problemas 
morales dificiles, Kohlberg disefid una scric de 
dilcmas morales. Uno de los mds famosos es 
el de Heinz y el farmaceutico: 

En Europa, una mujer se enconlraba cerca de la 
muerte debkto a un tipo especial de cancer Ha- 
bia un medicamento que los doctores considera- 
ban que podria salvarln Era una forma de radio 
que un farmacbutico en el mismo pueblo habla 
descubierto recientemente. Era costoso produ¬ 
ct el medicamento, pero el farmaceutico cobra- 
ba 10 voces mds de to que le costa ba mandar 
hacer la medicina. Pagaba $200 por el radio y 
cobra ba $2 000 por una dosis pequena de la dro- 
ga. El esposo de la mujer enferma. Heinz, acu- 
dio con todas las personas a las que conocfa para 
pedir prestado el dinero, pero s6k> pudo reunir 
cerca de $1 000, que es la mltad del costo. Le 
dijo al farmaceutico que su mujer eslaba murlen- 
do y le pidk) que le vendiera la medicina mds 
barata o que le permitlera pagarle despuds. Pero 
el farmaceutico dijo, “No, yo descubri la medici¬ 
na y voy a obtener dinero de ella“. Por ese mob- 
vo, Heinz se sinlid desesperado e irrumpki en la 
tienda del fanmacdutico para robar et medicamen¬ 
to para su esposa (Kohlberg y Effenbein, 1975). 

Despuds de leer o cscuchar esta hisloria. se ha- 
ccn una serie de preguntas dc sondco a la per¬ 
sona evaluada. listas podrfan ser como las 
siguientes: /.Heinz deberfa haber robado la me¬ 
dicina? ^Qud sucede si Heinz no amaba a su 
esposa? /,Eso cambian'a la situacidn? /,Que pasa 
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si la persona que estaba muriendo fuera una 
desconocida? ^Heinz deben'a robar de todas 
fnaneras el mcdicamcnlo? Con base cn las rcs- 
puesias a cstc y olros dilemas, Kohlberg con- 
duyd que existen tres nivcles principales de 
razonamienlo moral, con dos subetapas dentro 
de cada nivel (cuadro 12-7). Un empleo para 
este instrumento de mcdicidn, la Moral Judge¬ 
ment Scale (Escala de Juicio Moral), consiste 
en determinar la etapa de razonamienlo moral 
de la persona evaluada.* 

La Escala de Juicio Moral consiste de va¬ 
ries dilemas hipottfticos como el de Heinz y el 
farmacdutico, los cualcs sc presentan uno a la 
vez (Colby, Kohlberg, Gibbs y colaboradorcs, 
1978). En su ultima revisidn, la Escala se pre- 
senta cn tres versiones llamadas Formas A, B y 
C. La calificacidn es bastantc compleja y se basa 
en cl juicio del examinador accrcu dc las rcs- 
puestas en relacidn con extensos criterios des- 
critos en un detallado manual de calificacidn 
(Colby y Kohlberg, 1987). Aunquc existen va- 
rias dimcnsioncs diferentes para la calificacidn, 
el clemento que se cita con mds frecuencia en 
los estudios dc invcstigacidn es la etapa gene¬ 
ral dc razonamienlo moral que caractcriza a la 
persona evaluada. 

CRfnCA DE LA ESCALA DE JUICIO 
MORAL 

Las primeras versiones dc la Escala de juicio 
moral sufricron graves defcctos de calificacidn 
c intcrprctacidn. Por cjcmplo, en su tesis doc¬ 
toral. Kohlberg (1958) propuso dos sistemas 
de calificacidn: uno que utilizaba una oracidn o 
pensamiento completo como la unidad dc cali- 
ficacidn y el otro que dependfa de la califica- 
cion global dc todas las expresioncs del indi viduo 
como la unidad dc andlisis. Ninguno de los en- 
foques fue completamcnte satisfactorio y las 
primeras revisiones de la escala tuvieron erfti- 


* Aunquc la Escala dc Juicio Moral sc ha utilizado am- 
pliamcnte para la invcstigacidn empfnea, Kohlberg 
(1981, 1984) sugicrcquc su aplicacidn mds valiosacs 
para la promocidn dc la autocomprcnsidn y cl desa- 
rrollo del razonamienlo moral cn cl indi viduo evaluado. 


Cuadro 12-7. Niveles y etapas del 
desarrollo moral segun Kohlberg 

Nivel 1: Preconvencional 

Etapa 1. Orientacidn hacia el castigo y la obe- 
diencia: las consecuencias fisicas de- 
terminan lo que es bueno o malo. 
Etapa 2. Orientacidn al relativismo instrumental: 
es bueno aquello que satisface las pro- 
pias necesidades. 

Nivel 2: Convencional 

Etapa 3. Orientacidn hacia la concordance in¬ 
terpersonal: es bueno aquello que com- 
place o ayuda a los demas. 

Etapa 4. Orientacidn hacia la “ley y el orden“: Es 
bueno aquello que conserva el orden 
social y cumplir con el propio deber. 

Nivel 3: Posconvencional o de principios 

Etapa 5. Orientacidn legal-de contrato social: Los 
valores acordados por la sociedad de- 
terminan lo que es bueno. 

Etapa 6. Orientacidn de principios dticos univer- 
sales: aquello que es corredo es una 
cuestidn de consciencia y se obtiene de 
principios universales. 

Fuenlo: Basftdo en Kohlberg (1984) 

cas justificables acerca de la confiabilidad y 
validezdcl instrumento (Kurtincs y Grcif, 1974). 

En respuesta a estas cnticas, Kohlberg y 
sus colaboradorcs desarrollaron un sistema dc 
calificacidn que no tiene paralcto en cuanto a 
su claridad, detalle y complejidad (Rest, 1986). 
Por fortuna, dado que los dilemas de la Escala 
de Juicio Moral han permanecido constantes a 
lo largo de los afios, es posible aplicar los nue- 
vos sistemas dc calificacidn a los viejos datos. 
La capacidad dc volver a analizar los viejos 
datos y compararlos con los nuevos es inestima¬ 
ble para determinar la confiabilidad y validez 
dc una escala existente. Uno dc los estudios mfc 
importantes en este sentido fue el publicado por 
Kohlberg y colaboradores (Colby y cols., 1983). 

Esta investigacion presenta los resultados 
de utilizar el nuevo sistema de califtcacion en 
un estudio longitudinal que abared m£s dc 20 
anos. £stos fueron impresionantes y ofrecen 
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fuerte sustentacibn a la confiabilidad y validez 
del instrumento. Las corrclacioncs tesi-retesl 
para las tres formas sc colocaron en la parte 
superior del rango de .90. al igual que las co- 
rrelaciones intercalificudores. Las calificacio- 
ncs longitudinalcs de los individuos sometidos 
a prueba en intervalos de tres a cuatro anos du¬ 
rante 20 anos revelaron tendencias consis¬ 
tent con la tcorfa. De los 58 individuos, 56 
mostraron cambio en sentido progresivo y nin- 
guno saltb alguna etapa. Lo que es mas. sblo 
6% de las 195 comparaciones mostraron cam- 
bios en sentido inverso entre dos sesioncs de 
prueba. La consistcncia interna de las califica- 
cioncs tambidn fue cxcclcntc: ccrca de 70% de 
dstas se colocaron en una etapa y s61o 2% se 
dispersaron mds alia de dos etapas adyacentes. 
La calificacibn de la prueba alfa de Cronbach 
se colocb a la mitad del rango de .90 para las 
tres formas. Nisan y Kohlberg (1982) corrobo- 
raron estas conclusioncs. Heilbrun y Georges 
(1990) tambidn dan un informc favorable 
accrca de la validez de la Escala de Juicio Mo¬ 
ral. en la medida en que el desarrollo poscon- 
vencional se correlaciona con niveles mbs 
elevados de autocontrol, como se predecirfa a 
partir del hecho de que las personas moralmen- 
te maduras sc oponen eon frecuencia a la pre- 
sibn social o a las rcstriccioncs legates. En 
resumen. la Escala de Juicio Moral es confiable, 
consistente a nivel intemo y posee una cohe- 
rencia evolutiva confirmatoria de la teoria. 


PRUEBA DE CUESTIONES 
DETERMINANTES 

La Defining Issues Test; DIT (Prueba de Cues- 
tiones Determinantes) es similar a la Escala de 
Juicio Moral, pero incorpora un formalo de cali¬ 
ficacibn mucho mds send llo y complctamcntc 
objelivo (Rest, 1979, 1986). La persona eva- 
luada lee una scrie de dilemas morales simila- 
rcs a los disenados por Kohlberg y despuds elige 
una accibn apropiada para cada uno. Porejem- 
plo, un dilema implica a una pacicntc que ticne 
una agonfa muy dolorosa debida al edneer. En 
sus momentos de lucidcz pidc que se le aplique 


una sobredosis de morfina para acelerar su 
muerte. ^Qud deberfa hacerel mddico? Sc listan 
tres opciones del siguientc tipo: 

_Dcberia darle una dosis mortal. 

_No deberfa darle una sobredosis. 

_No puedc dccidir. 

La opcibn de la persona evaluada no entra di- 
rectamente en la determinacibn de la califica- 
cibn de juicio moral. El propbsito real de forzar 
una eleccibn consiste en hacer que la persona 
examinada piensc accrca de la importancia de 
diversos factores para lomar la decisibn. Des¬ 
pues de optar por la accibn apropiada, el exa- 
minando califica la importancia de varios 
factores en una escala Likert de cinco puntos: 
gran, mucha, alguna. poca o ninguna importan¬ 
cia. Los factores son diferentes para cada dile¬ 
ma. Los factoies difteren en cl nivel de juicio 
moral que implican y van desde la etapa 1 has- 
ta la etapa 6 de Kohlberg. En el caso del dilema 
anterior, los factores incluyen cuestiones tales 
como las siguientes: 

_Si el mddico puede haccrlo parecer 

un accidente. 

_La socicdad puede permitir que las 

personas terminen con su vida cuan- 
do lo deseen. 

_Si la familia de la mujer favorece darle 

la sobredosis o no. 

Estas clasificaciones forman la base para gene- 
rar varias calificaciones cuantitativas que tie- 
nen que ver con el juicio moral de la persona 
evaluada. La calificacibn de mfis amplia utili- 
zacibn es la P, que es cl porcentaje de razona- 
miento de principios. El rango de confiabilidad 
de las calificaciones P varfa de P de .71 a .82 
en los estudios test-retesl (Rest, 1979, 1986). 
La validez ha sido cstudiada mediante contras- 
tar grupos conocidos que se sabe son diferen¬ 
tes en el razonamiento de principios. Por 
ejemplo, sc encontrb que los estudiantes de 
posgrado en filosoffa moral y en ciencias polf- 
ticas, estudiantes universilarios en general, es¬ 
tudiantes de preparatoria y estudiantes de 
secundaria diferian de manera apropiada y sis- 
temdtica en cuanto a la calificacibn P. En estu- 
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dios longitudinales, se enconiraron tcndcncias 
significalivas cn scntido progresivo a lo largo 
dc seis afios y cuatro cvaluaciones. De manera 
recienle, Rest ha recomendado una nueva me- 
dida del juicio moral, el fndice N2, quc sc cal- 
cula con base en varias formulas compiejas que 
utilizan tanto datos de clasiflcacibn como de 
calificacibn. Los dos Indices sc correlacionan 
dc manera elevada en el rango del .90. No obs¬ 
tante, en un anblisis retrospectivo de estudios 
previos, el fndice N2 superb al fndice P por un 
margen sustancial (Rest, Thoma, Narvaez y 
Bebeau, 1997). 

Sc han publicado mbs dc 600 artfculos so- 
bre la Prucba de cuestiones determinants 
(McCrae, 1985;Moreland, !985;Sutton, 1992). 
En general, se considcra que el instrument es 
una alternativa a la Escala de Juicio Moral dc 
Kohlberg, en particular para la investigacibn 
dc diferencias grupalcs en razonamiento moral. 
Sin embargo, los revisores sehalan varias adver- 
tcncias acerca dc la DIT(Sutton, 1992; Westbrook 
y Bane, 1992). Primcro, la prucba utiliza dos di- 
lemas de la guerra dc Vietnam y. por tanto. cs un 
pocoanticuada. Muchos individuos jbvenes tie- 
nen poco conocimiento (y quizb ningun inte¬ 
rns) en cuanto a este tema y puede resultarles 
diffcil idcntificarse con estas cuestiones. Otro 
dilema —el caso clbsico de si Heinz debiera 
robar cl medicamcnto para salvar la vida dc su 
esposa— tambibn tiene un valor dudoso ya quc 
se le ha dado amplia publicidad y se le ha pu¬ 
blicado en texts universitarios. Una propor- 
cibn significativa dc examinandos potenciales 
conocen mbs quc bien este dilema moral. 

Richards y Davison (1992) han enfatizado 
la cucstibn dc que la DIT tiene un prejuicio 
contra individuos de convicciones religio- 
sas conscrvadoras. Ciertamentc se ha cstable- 
cido que las personas con creencias religiosas 
conscrvadoras o fundamcntalistas tienden a ob- 
tencr calificaciones inferiores al promedio en 
la calificacibn P dc la Prueba dc cuestiones de- 
terminantes (Getz, 1984; Richards, 1991). Se- 
gun Richards y Davison (1992), la razbn para 
esto es que los reaclivos de la Etapa 3 y 4 po- 
seen (de manera no intencional) fuertes impli- 
caciones tebricas que causan que los individuos 


fundamcntalistas refrenden los reactivos, con 
lo cual rcduccn su calificacibn cn la prucba. 
Considbrense los reactivos que se dirigen al ra¬ 
zonamiento de la etapa 4, relacionada con la 
orienlacibn de “ley y orden’’, que hace una equi¬ 
valence entre lo que es “moral” y el cumplir 
con el propio deber y mantener el orden social. 
Mientras que las personas no religiosas podrfan 
estar dc acuerdo con las leyes terrenales (y re- 
frendar los reactivos de la etapa 4) debido a que 
creen que las autoridades legates deftnen lo 
que es correct y moral, las minorfas religiosas 
como los mormoncs creen que respetar las le¬ 
yes terrenales es una obligacibn teolbgica y re- 
ligiosa quc fluyc dircctamente de los artfculos 
de fe en su religibn: 

... aunque los mormones le dan un alio valor a 
obedecer la ley y apoyar a las autoridades lega- 
les, 6ste se debe a su creencia religiose de que 
Dios les ordena hacorlo y no debido a que crean, 
como los individuos con un pensamiento que real- 
mente se encuentra en la Etapa 4, quo las leyes 
terrenales o las autoridades legates definen lo 
que es correcto o moral (Richards y Davison, 
1992, 470). 

Estos investigadores demuestran de manera em- 
pfrica quc ciertos reactivos de la DIT miden 
un construct diferente para las personas con 
creencias religiosas conscrvadoras quc para la 
poblacibn general. En consecuencia, la validez 
de la prucba para estos grupos estb abierta a 
discusibn. 

Una crftica relacionada acerca de la DIT 
es la escasez de normas relatives a grupos mi- 
noritarios. Por ultimo, Westbrook y Bane (1992) 
afirman que el manual tbcnico de la DIT carc- 
cc de los detalles csenciales necesarios para 
valorar la idoncidad dc la prueba. A pesar de 
estas crflicas, la DIT es una prueba sumamente 
respeiada, en particular para la investigacibn 
sobrc razonamiento moral. 

EVALUACI6N de conceptos 
ESPIRITUALES Y REUGIOSOS 


Dentro del campo dc la psicologfa, los temas 
trascendentales como cl bicncstar espiritual o 
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la madurez de la fe nunca han recibido atcncion 
de los investigadores convcncionales. Hace 50 
aiios, Gordon Allport (1950) se lamcntaba de 
quc cl tema de la rcligidn "parecfa haberse ocul- 
tado" cnlre los intclectualcs c investigadores 
academic os: 

Sin importar cual pueda ser la razbn, la pereteten- 
cia de la religkin en el mundo moderno parece 
ser motivo de verguenza para los eruditos de la 
actualldad. Incluso los psiaMogos, para qutenes 
supueslamente ninguna de las cuesliones hurna- 
nas les es ajena. eslfin en probabilidad de re- 
traerse cuando se saca a relotir el tema (p. 1). 

La situacidn ha mejorado poco en la dpoca con- 
temporiinea. Por ejemplo, excepto por unas 
cuantas revistas especializadas, los temas espi- 
rituales y rcligiosos estdn casi ausentes en la 
litcratura psicoldgica. 

No obstante, los investigadores no ticncn 
cl dcrccho de rctirarsc del campo, dada su im- 
portancia para la persona promedio. Considd- 
rense las csladfsticas sobre crccncias religiosas 
en EUA, establcs desdc 1944, cuando sc pusie- 
ron en pr&clica por primera vez las cncuestas 
(Hoge. 1996): 

• La creencia en Dios ha permanccido constan- 
te en aproximadamente 95% de la poblacidn. 

• De 75 al 77% de los adultos sc adhieren a la 
creencia en la divinidad de Jesucrisio. 

• La creencia en la vida despuds de la muerte 
persiste en cerca de 75% de la poblacidn. 

No sc encuentran disponibles estadfsticas com¬ 
parables a nivel mundial, pero parece probable 
quc cl porcentaje de indi viduos creyentes (ya sean 
musulmancs, budistas, hinducs, judfos u otros) 
sea muy alto. La mayorfa de las personas se adhie¬ 
ren a alguna perspecliva religiosa en la vida y, con 
toda seguridad, csto debc tencr alguna relacidn 
con su adaptacidn, conducta y perspecliva. 

Por desgracia, el campo de la psicologfa, 
incluyendo el drea de cspccialidad de las pruc- 
bas, ha conscrvado en gran medida una actitud 
indiferente hacia este important aspecto de la 
cxperiencia humana. Peor aun, en muchos ctrcu- 
los intclectualcs, la accptacidn de sentimientos 
espirituales o rcligiosos se considcra como evi- 


dencia de psicopatologfa. Entrc otros, Sigmund 
Freud se adhirid a una perspecliva ct'nica de la 
rcligidn en su ensayo adecuadamentc titulado 
The Future of an Illusion (El porvenir de una 
ilasion; 1927/1961). Sin embargo, para muchas 
personas la conexidn con lo trasccndcnte cs 
cscncial para cl significado de la vida. Estoocu- 
rrc especialmcntc en tiempos de cautivcrio, 
como cuando la aniquilacidn de uno mismo toca 
a la puerta. Considerese la experiencia de Viktor 
Frankl (1963), un superviviente de un campo 
de exterminio nazi y figura fundadora de la psi¬ 
cologfa existencial. En algun momento de la 
segunda Guerra Mundial tuvo que resignarse a 
perdcr su abrigo con un aprcciado manuscrito 
en los bolsillos, a cambio dc los andrajos he- 
chos pedazos de un interno enviado a la cama- 
ra de gas: 

En lugar de las muchas paginas de mi manuscri¬ 
to. encontrd en un bolsillo del recientemente ad- 
quirido abrigo una soia paglna arrancada de un 
libro hebreo de oraciones que contenia la princi¬ 
pal oracion Judia, Shema Yisrael. i,C6mo debe- 
ria haber interpretado tal 'coincidencla". si no 
como un reto a vivir mis pensamientos en vez de 
s6lo ponerlos en papet? 

En lo que resta dc este tema, se toma la pers- 
pcctiva dc quc las dimensiones espirituales y 
religiosas dc la vida satisfacen a menudo pro- 
pdsitos constructivos y que la evaluacidn den- 
tro dc cstas areas cs digna de cstudio adicional. 

FUNDAMENTACION PARA LA 
EVALUACI6N RELIGIOSA 
Y ESPIRITUAL 

Los investigadores acaddmicos justifican la 
cvaluaci6n de las dimensiones religiosa y espi- 
ritual como un medio para buscar la verdad 
acerca de la conducta humana. Su principal 
motivo es la curiosidad intelectual y su meta es 
la comprcnsidn del papel de la religidn y de la 
espiritualidad en los asuntos humanos. Pero, 
l,cxistc algun tipo de razdn practica para inten- 
tar medir las dimensiones religiosa o espiritual 
en el individuo? Por ejemplo, £los profesiona- 
les clfnicos, como psicdlogos o trabajadores 
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sociales, obtiencn alguna informacidn util dc la 
cvaluacidn de los anlcccdcntcs rcligiosus y es- 
pirituales dc sus clicntcs? 

Richards y Bergin (1997) ofrccen varios 
argumcntos convincentcs a favor de quc los tc- 
rapeutas evaluen los antecedentes religiosos y 
espirilualcs de sus clicntes. En lerminos espe- 
cfficos. esta forma de cvaluacidn servirfa para: 

1. Aumentar la empatfa al ayudar a los terapeu- 
tas a comprender mejor la perspectiva glo¬ 
bal dc sus clientcs. 

2. Identificar y cvaluar cl impacto de las orien- 
taciones religiosas-espiritualcs sanas y pa- 
loldgicas dc sus clicntcs. 

3. Determinarsi las creencias religiosas y espi- 
ritualcs y la comunidad pucden proporcio- 
nar apoyo a los clicntcs. 

4. Identificar las posibles intervenciones cspi- 
rituales que pucden cmplearse en terapia para 
ayudar a los clientes. 

5. Determinar si dstos posecn dudas o preocu- 
paciones espirilualcs no rcsucltas que nece- 
siten atenderse. 

En general, Richards y Bcigin (1997) afirman 
que los clfnicos necesitan atender a la persona 
completa, a fin de proporcionar la mejor res- 
pucsta posible a los problcmas emocionales y 
psicoldgicos. Dcbido a que la mayori'a de los 
clientes llevan sus preocupacioncs religiosas y 
espirilualcs a la sesidn de terapia, los clfnicos 
quc evaluan cstas dimensiones de la existence 
human.i pueden estar mejor preparados para 
proporcionar un scrvicio eficaz. 

PERSPECTIVA HISTORICA GENERAL 
ACERCA DE LA EVALUAOON REUGIOSA 

El interds en la psicologfa dc la religidn puedc 
rastrearse a inicios del siglo XX cuando William 
James (1902) escribi6 su obra maestra. The 
Varieties of Religious Experience. En este li- 
bro, James catalogo las muchas maneras en que 
los seres humanos revelan su interds por cues- 
liones trascendcntalcs. Su conclusion general 


fuc quc la religidn cs “un drgano csencial de 
nucstra vida, que lleva a cabo una funcidn 
que ninguna otra parte de nuestra naturaleza 
puede satisfacer con tanto dxito”. 

Aunque muchos autores han ofrccido ana- 
lisis psicologicos dc la rcligidn desde loscscri- 
tos originates de James, no fuc sino hasta el 
decenio de 1960 que comenzaron a apareccr 
esealas para la cvaluacidn de las variables reli¬ 
giosas (Wulff, 1996). Una dc las primeras me- 
didas dc cstc tipo fucron las Allport-Ross 
Religious Orientation Scales (Esealas Allport- 
Ross de orientacidn religiosa), que proponfan 
evaluar dos dimensiones de la expresidn reli¬ 
giosa, la intrfnscca y la extrfnseca (Allport y 
Ross, 1967). Sc consideraba quc las personas 
con religiosidad intrfnseca vivfan su religidn 
(p. cj., para encontrar significado, direccidn, 
perspectiva), mientras quc sc crcfa quc aque- 
llas con religiosidad extrfnseca utilizaban su 
rcligidn (p. cj., para buscar seguridad, cstatus, 
sociabilidad). En sus primeros cscritos sobre cl 
tema. Allport hizo referenda a la forma intrfn¬ 
scca como una oricntacidn religiosa genuina o 
madura, mientras quc la extrfnseca se considera¬ 
ba inmadura. Postcriormentc hizo a un lado las 
dcnominaciones madura-inmadura, porque 
las etiquetas parccfan demasiado crflicas. 

El fmpetu para cl desarrollo dc estas esea¬ 
las fue la angustiosa observacidn de Allport de 
una relacidn positiva entre religiosidad (en 
cicrtas formas) y actitudes dc autoritarismo, in- 
tolerancia y prejuicio. Como una persona devota- 
mente religiosa, Allporl se mostraba convenci- 
do dc que serfa poco comun que los individuos 
con una orientacidn religiosa intrfnscca alber- 
garan dichas actitudes. Despuds dc todo, un 
prcccpto csencial de casi toda crecncia religio¬ 
sa es una actitud de amor hacia el prdjimo. En 
la fc cristiana, esta perspectiva se resume en la 
famosa sentcncia: “Amards a tu prdjimo como 
a ti mismo" (Marcos 12:31). No obstante, la 
evidencia abrumadora para Allport fue que al- 
gunos individuos religiosos revelaban odio, in¬ 
tolerance y prejuicio hacia sus semejantes. Los 
objetivos comunes de estas actitudes malicio- 
sas cran las minonas raciales, los judfos y las 
personas homoscxualcs, entre otros. Allport 
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razond que las personas religiosas con actitu- 
des intolerantes poscfan prcdominantcmcnte una 
orientacidn religiosa extrfnseca; es decir, su fe 
satisfacfa mctas extcmas como la position den- 
tro de la comunidad, la pertenencia a un grupo 
y simiiarcs. La investigacidn sobre esta hipdte- 
sis (de que las personas con religiosidad ex¬ 
trfnseca mostrarfan mayor autoritarismo, 
intolerancia y prejuicio que aqudllas con religio¬ 
sidad intrfnscca) rcquirid de las herramientas 
apropiadas. Para tal propdsito, Allport y sus 
colaboradores desarrollaron las escalas de 
Orientacidn religiosa. 

Ejemplos de los tipos de reaclivos cn la 
escala Extrfnseca de 11 de ellos y en la esca- 
la Intrfnscca de 9 son los siguientcs: 

• La iglesia cs important como lugar para dc- 
sarrollar buenas rclaciones sociales (extrfn¬ 
seca). 

• En ocasiones me parece necesario compro- 
metcr mis creencias religiosas por razoncs 
econdmicas (extrfnseca). 

• Intcnto firmemcnte llevar mi rcligidn a otros 
aspectos de mi vida (intrfnseca). 

• Mi religidn es importante porquc proporcio- 
na signiftcado para mi vida (intrfnseca). 

Aunque en un principio se le disefid cn un for- 
mato de sf-no, las aplicaciones modemas de 
estas escalas utilizan un continuo de nueve pun- 
tos dcsde (1) fuertemcnte en desacuerdo hasta 
(9) fucrtemente de acuerdo (Batson, Schocnrade 
y Venus, 1993). 

La investigacidn sobre las escalas de Orien- 
tacidn religiosa no ha proporcionado un fucrtc 
apoyo a la hipdtesis original de Allport (Wulff, 
1996). De hecho, varios estudios han mostrado 
que las personas con puntuaciones mds altas 
en la escala Intrfnseca revelan. de hecho, ma- 
yores nivclcs de autoritarismo, intransigencia 
y prejuicio hacia afroestadounidenses, homo- 
sexuales y lesbianas. Hunsberger (1995) con- 
cluye que no es la religidn en sf la que da lugar 
al prejuicio, como tampoco la oricntacidn reli¬ 
giosa intrfnseca/cxtrfnseca. En vez de cllo, "cs 
la manera cn la que se sustentan las creencias 
religiosas lo que parece asociarse de manera 


mds directa con el prejuicio y esto se explica 
mejor por medio del vinculo estrecho con la 
tcndencia hacia cl fundamentalismo y al autori¬ 
tarismo de dcrecha". En tdrminos espccfficos, 
este autor vincula el prejuicio hacia las mino- 
rfas con las tradiciones religiosas autoritarias 
que promueven una verdad absoluta, dividen 
al mundo en fuerzas del “Bien" y del "Mai" y 
evitan la complejidad y la duda en sus sistemas 
dc creencias. Estos aspectos de la expresidn 
religiosa no se miden por lo comun a traves de 
pruebas dc Idpiz y papel. 

En un estudio reciente, Genia (1993a) con- 
cluyd que las escalas combinadas de Oricnta¬ 
cidn religiosa (que consistcn de 20 reactivos) 
miden tres faclores de expresidn religiosa y no 
los dos propuestos por Allport (Intrfnscca y 
Extrfnseca). Esta investigadora llevd a cabo un 
andlisis factorial de los rcsultados de la prueba 
de 309 personas entre 17 y 83 arios (edad me¬ 
dia dc 29 ados), provenientes de diversas tradi¬ 
ciones religiosas. Los nueve reactivos en la 
escala Intrfnseca original se agruparon dc ma¬ 
nera muy adecuada, lo cual da lugar a un factor 
robusto de oricntacidn religiosa intrfnscca. Pero 
los 11 reactivos en la escala Extrfnseca origi¬ 
nal se separaron cn dos subfactores mdepen- 
dicntcs que Genia (1993a) denomind uso de la 
religidn para beneficios personates (Ep) y para 
rccompensas sociales (Es). La autora rccomen- 
dd transformar el instrumento original en una 
prueba dc tres factorcs (Intrfnseca, Extrfnseca- 
personal, Extrfnseca-social) al anadir y elimi- 
nar unos cuantos reactivos. No obstante, la 
mayorfa de las autoridadcs en el campo han 
concluido que las escalas dc Allport satisficic- 
ron una valiosa funcidn al idcntificar dimen- 
sioncs clave dc la experiencia religiosa y 
estimular la investigacidn, pero en la actuali- 
dad ya no son utiles. 

reugi6n como busqueda 

Cada vez cs mils frecuente que la base concep¬ 
tual para la distincidn entre orientacidn religio¬ 
sa Intrfnseca y Extrfnseca se ponga en tela de 
juicio. Kirkpatrick y Hood (1990) resumen las 
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principals crfticas tedricas y metodoldgicas 
para las escalas de la siguicnte manera: 

• Una falta dc claridad conceptual en cuanto a 
aquello que sc supone quc las escalas Intrfn- 
seca y Exufnseca miden. /,Son tipos de mo- 
tivacidn (es decir, los motivos asociados con 
la crecncia y pnSctica religiosa) o variables 
de la personalidad (cs decir. aspectos gene- 
rales de la conducta o participacidn institucio- 
nal) o alguna otra cosa? 

• Una confusidn acerca de la relacidn entrc las 
escalas Intrfnseca-Extrfnseca. En particular, 
/.son cxtrcmos opucstos de una sola dimen¬ 
sion bipolar o las escalas miden dimcnsioncs 
independientes (de modo que serfa conccbiblc 
la posibilidad dc que algunas personas pu- 
dieran tener alias calificacioncs en ambas)? 

Otros problemas mencionados incluycn la de- 
bilidad en la estructura factorial, confiabilidad 
y validez de constructo de las escalas; la de¬ 
pendence excesivaen una dicotornfa entre “re- 
ligidn buena” y “rcligidn mala" y la insensatez 
de defimr y estudiar la rcligiosidad indcpcn- 
dientemcntc del contenido de la creencia 
(Kirkpatrick y Hood, 1990). 

En respucsta a las limitaciones de las esca¬ 
las de Orientacidn religiosa, Batson y colabo- 
radores (1993) desarrollaron una medida de una 
tcrcera orientacion religiosa conocida como 
Busqueda. Estos investigadores consideran a 
la Busqueda como una perspectiva religiosa 
m^s madura y flexible que las oricntaciones 
Intrmseca y Extrfnseca. De hecho. Allport re- 
conocio los elementos inherentes en esta oricn- 
(acidn, pero no los incorpord en su escala 
Intrmseca. La Busqueda se caracteriza por la 
complcjidad, duda y vacilacidn como maneras 
de ser religioso. Esta orientacidn sugicrc: 

... un enloque que impllca entrentar de manera 
bonesta las preguntas existenciales en loda su 
complejidad, mientras que al mismo tiempo se 
resisten las respuestas irrelutables y convenlen- 
tes. Un indivlduo que se acerca a la religion de 
este modo reconoce que no sabe, y probable- 
mente nunca sepa, la verdad ultima acerca de 
tales cuesliones. Aun asi, las preguntas se con¬ 


sideran importantes y, a pesar de que son lenta- 
tivas y sujetas a cambio, se buscan las res¬ 
puestas. Puede existir o no una creencia clara 
en una realidad trascendente, pero exists un 
aspeclo trascendental. retrgioso, en la vida del 
individuo. Le llamaremos a este enloque abierto. 
de cueslionamiento, rellgidn como busque¬ 
da (Batson y cols.. 1993. p.166). 

Ejemplos de los 12 reactivos en la escala de 
Busqueda son los siguientes: 

• Mis experiences vilales me han conducido a 
reconsiderar mis convicciones religiosas. 

• Las dudas religiosas me parccen perlurbado- 
ras [se califica cn sentido inverso). 

• Espero que mis creencias religiosas cambicn 
a medida que crezca y madure. 

• Dentro de mi fe religiosa, las preguntas son 
mis importantes que las respuestas. 

Los reactivos se califican en el mismo conti- 
nuo de nueve puntos desde (1) fuertemente cn 
dcsacuerdo, hasta (9) fuertemente de acuerdo. 
Los resultados se presentan como una califica- 
cidn promedio. La investigacidn con 424 cstu- 
diantes dc pregrado intcrcsados en la religidn 
indica quc la Busqueda es. dc hecho, una di- 
mensidn de la cxperiencia religiosa que cs in- 
dependiente tanto de la orientacidn Intrfnscca 
como de la Extrfnseca. Mientras que las pun- 
tuaciones dc las escalas Intrfnscca y Exirfnseca 
se correlacionaron en .72, Busqueda reveld 
relaciones insignificantes con ambas escalas 
(-.05 con intrfnseca y .16 con Extrfnseca). 

Pero ^exactamente que mide la escala de 
Busqueda? La intencidn de sus autores fue que 
evaluara “el grado al que la religidn de un indi¬ 
viduo implica un didlogo abierto, neceptivo, con 
preguntas existenciales surgidas dc las contra- 
dicciones y tragedias de la vida" (p. 169). Los tres 
componentes de la oricntacidn de busqueda 
son: I) disposicidn para enfrentar las preguntas 
existenciales sin reducir su complejidad, 2) auto- 
crftica y perccpci6n de las dudas religiosas 
como positivas y 3) apertura al cambio. Pero 
los crfticos han presentado la acusacidn dc que 
es posible que la escala no mida alguna especie 
de religiosidad y que en vez dc cllo evalue posi- 
blemente el agnosticismo. la actilud contraria a 
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la ortodoxia, las dudas religiosas o el confliclo 
rcligioso. 

En rcspuesta a eslas crilicas, Batson y co- 
laboradores (1993) senalan lo siguiente: 

• Los estudiantes en cl Seminario Tcol6gico de 
Princeton tuvicron calificacioncs significa- 
tivamentc mils alias (p < .001) en la cscala 
de Busqueda (media dc 6.7) quc los estu- 
dianlcs de pregrado en la misma institucidn 
(media de 5.2). Esta conclusi6n sustcnta la 
perspectiva de que la cscala es una mcdida 
vtilida de algun tipo dc religiosidad. 

• Los 32 miembros de un grupo carismdtico de 
estudio dc la Biblia tuvicron calificaciones 
significativamente mis elevadas (p < .001) 
en la escala de Busqueda (media de 5.5), que 
los 26 miembros de un grupo tradicional de 
estudio de la Biblia (media de 4.6). El grupo 
carismdlico situaba cl dnfasis en la rcligidn 
como busqueda compartida; la mayorfa rc- 
zaban con las manos en alto y algunos miem¬ 
bros hablaban en lenguas. 

La Busqueda es una dimensidn independiente 
de expresidn rcligiosa y se ha llevado a cabo 
una invcstigacidn sustancial acerca del signifi- 
cado y correlatos de esta orientacidn hacia la 
fe. Batson y colaboradores (1993) resumen 
la investigacidn con la escala de Busqueda al 
sciialar quc parccc medir una rcligidn de me- 
nor fe, pero mayor esfuerzo. 

El conccpto dc Busqueda surgi6 cn respues- 
ta a las limilaciones del enfoque Inlrinseco y 
Extrfnseco para la medicidn de la orientacidn 
rcligiosa. Pero esta breve cscala dc 12 reactivos 
posee sus propias limitaciones, entre las cuales 
se pueden mencionar principalmente su breve- 
dad y sencillez factorial. Sc han propuesto va- 
rios otros instrumentos para medir aspectos de 
la expericncia rcligiosa. En las siguientes sec- 
cioncs se revisan unos cuantos enfoques des- 
tacados y reprcsentativos. 

ESCALA DE BIENESTAR ESPIR1TUAL 

El conccpto de biencstar espiritual puede ras- 
trearse hasta un artfculo dc Mobcrg (1971) que 


propuso esta forma de bieneslar como un com- 
ponentc esencial para el envcjecimienlo sano. 
El bicnestar espiritual se conccplud como un 
constructo bidimensional que consistc de una 
dimensidn vertical y una horizontal. La prime- 
ra lenfa que vercon cl bieneslar cn relacion con 
Dios o un poder superior, mientras que la se- 
gunda implicaba un biencstar existcncial que 
es un sentido de prop6sito en la vida sin ningu- 
na referenda religiosa especifica. Ellison (1983) 
y Paloutzian y Ellison (1982) cmprendicron cl 
reto dc dcsarrollar una escala para medir cstos 
componentes del bieneslar. 

Su instrumento sc denomind la Spiritual 
Well-Being Scale; SWB (Escala de Biencstar 
Espiritual). La Escala SWB consiste dc dos sub- 
escalas: Bieneslar rcligioso (RWB), quc evalua 
la dimensidn vertical del bicnestar en rclacidn con 
Dios; y Biencstar emocional (EWB), quc mide 
la dimensidn horizontal del bicnestar en rcla¬ 
cidn con el propdsilo y la satisfaccidn vitalcs. 
Cada subescala consiste de 10 reactivos que se 
califican desde 1 (fuertementc en desacuerdo) 
hasta 6 (fuertemente de acuerdo). Los reactivos 
de las dos subesealas se combinan cn la Escala 
SWB, donde los reactivos nones evaluan el 
biencstar rcligioso y los pares examinan el bie- 
nestar existcncial. Algunos dc los reactivos se 
frascan en sentido negativo; dstos se califican 
dc manera inversa, de modo que una califi- 
cacidn mds alta siempre indica mayor bienes¬ 
lar. En cl cuadro 12-8 sc muestran reactivos 
simiiares a los encontrados cn la Escala SWB. 

La Escala SWB proporciona Ires califica 
ciones: una calificacidn SWB total (mdximo 
120), una subcalificacidn para RWB (mdximodO) 
y una subcalificacidn para EWB (maximo 60). 
Los estudios inicialcs de confiabil idad y validcz se 
basaron cn 206 estudiantes de ires universida- 
des con orientacidn rcligiosa y una universidad 
secular. Los coeficicntcs dc confiabilidad test- 
retest se colocaron en .93 para la SWB, .96 
para la RWB y .86 para la EWB. Los anillisis 
factoriales tendieron a sustentar la validcz de 
constructo del instrumento al revclar quc todos 
los reactivos religiosos tenfan cargas en un fac¬ 
tor rcligioso, mientras que los existcnciales pa- 
reci'an tener carga en dos subfactores, uno 
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Cuadro 12-8. Reactivos similares a los encontrados en la 
Escala de bienestar espiritual 

Encierre en un cfrculo la afirmacidn que mejor indique el grado de acuerdo o desacuerdo que usled 
tenga con ella 

FA = Fuertemenle de acuerdo D = Desacuerdo 

MD a Moderadamente de acuerdo MD = Moderadamente en desacuerdo 

A = Acuerdo FD = Fuertemente en desacuerdo 


No encuentro mucha recompensa en re- 
zar de manera privada (calificacidn en di- 
reccidn inversa) 

FA 

MD 

A 

D 

MD 

FD 

Mi relacidn con Dios me ayuda a atrave- 
sar los momentos diffeiles 

FA 

MD 

A 

D 

MD 

FD 

La vida carece sustancialmente de sig- 
nilicado (calificacidn en direccidn inver¬ 

FA 

MD 

A 

D 

MD 

FD 

sa) 

Me siento bien acerca de la ruta que sigue 

FA 

MD 

A 

D 

MD 

FD 


mi vlda 


vinculado con la dircccidn dc la vida y cl olro 
que indicaba satisfaction con la vida. La corre¬ 
lation cntrc las subcscalas RWB y EWB fue 
modesta (r = .32), lo cual indica que dctcctan 
aspectos separados del bienestar espiritual. 

En escritos posteriores, Ellison describid a 
la Escala SWB como una tnedida de la integra¬ 
tion psicoespiritual de la personalidad y del 
bienestar resultante (Ellison y Smith, 1991). 
Scgun estc punto de vista, cl bienestar consiste 
de “la cxperiencia integral dc una persona que 
funciona segun los propdsitos de Dios, en rcla- 
cidn consonantc con 6l, con los demds y consi- 
go misma” (p. 36). fete cs cl concepto biblico 
dc shalom , el cual denota estar armoniosamcn- 
te en paz dentro y fuera. Si csta conceptuacidn 
cs corrects, la cspiritualidad sana como la mide 
la Escala SWB podria mostrar rciacioncs posi- 
tivas con medidas independientes de salud y 
bienestar subjetivo. Literalmente docenas de 
estudios han investigado csta hipdtesis global, 
con conclusiones positivas en tdrminos gene¬ 
rates. En el cuadro 12-9 se resumen los estu¬ 
dios representatives. 

El unico defecto idcntificado de la Escala 
SWB es un Ifmitc superior aparentemente bajo. 


Cuadro 12-9. Resumen de las 
conclusiones de la 
Escala de bienestar espiritual 

Las calificaciones de la Escala de bienestar 
espiritual se correlacionan positivamente con: 

Estar mas cerca del peso corporal ideal (Hawkins 
y Larson, 1984). 

Salud percibida en ancianos de areas rurales 
(DeCrans, 1990). 

Adaptation general a la hemodidlisis (Campbell, 
1988). 

Esperanza en pacientes con cancer (Mickley, 1990). 
Medidas de auloestima (Paloutzlan y Ellison, 1982). 

Las calificaciones de la Escala de bienestar 
espiritual se correlacionan negativamente con: 
Preside sangutnea diastdlica y sistdlica (Hawkins, 
1988). 

Frecuencia y cantidad de dolor en pacientes con 
edneer (Granstrom, 1987). 

Aislamiento social y desesperacidn (Bonner, 1988). 
Agresividad y evilacidn do conllictos (Bufford y 
Parker, 1985). 

Calificaciones de depresidn en el MMPI (Fehring, 
Brennan y Keller, 1987). 









570 • Evaluation pslcologica: Hlstorla, prindplos y apllcationes 


(Capitulo 12) 


en especial con muesiras religiosas. Ledbetter. 
Smith, Vosler-Hunter y Fischer (1991) advicr- 
ten que la utilidad clfnica de la escala esta limi- 
tada a las calificacioncs bajas (dado que las 
personas religiosas de alto funcionamicnto tien- 
den a “saiirse del lfmite superior” de la escala). 
Tambidn ofrecen sugcrencias para una revisidn 
(p. ej., volver a frasear los rcactivos en direccio- 
nes mds extremas), con el propdsito de elevar 
cl nivel superior de la Escala SWB. Bufford. 
Paloutzian y Ellison (1991) han publicado nor- 
mas para la prueba, pero advierten que en mu- 
chas muesiras religiosas el individuo comun 
rccibe la califtcacidn maxima. Esto indicaria 
que la escala es util en invcstigacidn, pero no 
es adccuada para distinguirentre individuoscon 
altos nivclcs dc bienestar cspiritual. 

ESCALA DE MADUREZ DE LA FE 

En 1987. seis de las principales dcnominacio- 
ncs protestantes emprendieron un cstudio na- 
cional a cuatro anos acerca de la fc personal, la 
alianza a una denominacidn y sus determinan- 
tes (Benson, Donahue y Erickson, 1993). Estc 
proyecto que subvenciond en parte el Lilly 
Endowment abared lo que es sin duda la medi- 
cidn miis compleja dc la madurez cspiritual que 
nunca se haya concebido. La Faith Maturity 
Scale; FMS (Escala de Madurez dc la Fe) sur- 
gid como herramienta practica para satisfacer 
ires propdsitos de investigacidn: 

1. Proporcionar una linea base sobre la vilali- 
dad de la fe en las principales congregacio- 
ncs protestantes. 

2. Identiftcar las contribuciones dc las varia¬ 
bles demogrdficas. personales y de la con- 
gregacidn para el desarrollo dc la fe. 

3. Proporcionar un critcrio variable para valo- 
rar cl impaclo de la educacidn religiosa en 
las principales denominaciones. 

El desarrollo de la escala fue un proceso lento 
y cuidadoso que comenzd con una definicidn 
funcional: 

La madurez de la te es el grado en que una per¬ 
sona abraza las prioridades, compromises y 


perspectives caracteristlcas de una te actlva 
y transformadora de la vida, como se le ha com- 
prendido en las ‘principales’ tradiciones pro- 
testanles (Benson, Donahue y Erickson, 1993, 
P-3). 

A travds de cuestionarios abiertos con una mues- 
tra apropiada de 410 adultos dc las principales 
denominaciones protestantes, los autorcs dc la 
prueba identificaron a continuacion ocho ditnen- 
siones centrales dc la madurez dc la fe. Tres 
piracies de asesores proporcionaron orientacidn 
continua durante esta etapa y en la fase siguiente 
de rcdaccidn de los reactivos. Estas intcraccio- 
nes garantizaron que la escala poseyera validez 
nominal y de contenido. 

La resultante FMS es una prueba con 38 
rcactivos que representa los indicadores clave 
de la madurez de la fe en ocho dreas principa¬ 
les (cuadro 12-10). Los reactivos se respon- 
den en una escala dc siete puntos desde 1 = 
nunca es cicrto. hasta 7 = siempre es cierto. Con 
base en las dreas evaluadas, el lector notard que 
la creencia corrccta es s6lo un aspecto dc la fe 
madura. En gran medida, la madurez de la fe se 
define por las consecuencias en cuanto a valores 
y conducta. Como senalan los autorcs, la Esca¬ 
la de madurez de la fe “se aparta de las mane- 
ras mds tradicionalcs de definir y medir la 
religidn personal”. No obstante, representa los 
tipos dc conductas y actitudcs que sc dcrivan 
de una fe dindmica y transformadora de la vida. 
Estas conductas y actitudcs son consistcntes con 
la teologfa que se encuentra en la mayor parte 
de las tradiciones religiosas. pero son especial- 
mente pertinentes para el propdsito de evaluar 
la madurez de la fe en el contexto protestante. 

La FMS sc califica como la media dc los 
38 reactivos, que produce un rango potcncial 
de 1 a 7. La puntuacidn promedio de 3 040 adul¬ 
tos de cinco denominaciones protestantes fuc 
dc 4.63, lo cual indica que el instrumento evita 
el “cfccto dc lfmite superior" que se encuentra 
en otras escalas como la Escala dc Bienestar 
Espiritual, que se analizd antes. La conftabili- 
dad cstimada de la escala es muy robusta entre 
edades, genero, ocupacidn y denominacidn, con 
coeficicntes alfa tfpicos de .88 (Benson et al., 

1993). No se presenta la conftabilidad test-retest. 



Evaluation vocational y de valores • 571 


Cuadro 12-10. Las ocho dimensiones 
centrales y reactivos de muestra de la 
Escala de madurez de la fe 


A. Confia y cree (cinco reactivos) 

Todos los dias veo evidencia de la influencia 
de Dios en el mundo. 

B. Experimenla los Irutos de la fe (cinco reactivos) 
Me siento abrumado por lodas mis responsa- 
bilidades (calificacion en direccion inversa). 

C. Integra la fe y la vida (cinco reactivos) 

Mi fe influye en la manera en que pienso y actiio 
todos los dias. 

0. Busca el crecimiento esplritual (cuatro reac¬ 
tivos) 

Tomo tiempo para meditar o rezar. 

E. Experiments y nutre la fe en la comunidad 
(cuatro reactivos) 

Hablo con otros acerca de mi fe. 

F. Tiene valores que defienden la vida (seis reac¬ 

tivos) 

Tiendo a ser critico de otras personas (califica- 
cidn en direccidn inversa). 

G. Defiende el cambio social (cuatro reactivos) 
Creo que las iglesias de este pais deberfan 
parlicipar en cuestiones polfticas. 

H. Acliia y sirve (cinco reactivos) 

Ofrezco cantidades significativas de tiempo pa¬ 
ra ayudar a los dem&s. 


Not*: Los reactivos de muestra son sinstates a los de la Escala 
de madurez de la fe 

Fuertte: Basado en Benson. P, Donahue, M y Erickson, J. (1993) 
The Faith Maturity Scale Conceptualization. Measurement and 
Empirical Validation En M L Lynn y D O Moberg (eds ), 
Research in the social scientific study ot religion (vol S) 
Greenwich. CT: JAI Press 

La validez de la escala recibe apoyo de va- 
rias lfncas dc evidencia que comienzan con un 
cuidadoso enfoque para la seleccidn de 
reactivos, a travds del cual se incorporan la vn- 
lidez aparentc y la de contenido. La validez de 
constructo sc demostrd de diversas mancras. 
Primero se predijo y se confirmd que los gru- 
pos supuestamente diferentes en niveles de ma¬ 
durez de la fe, oblcndrfan punluaciones medias 
significativamenle diferentes en la FMS. Dc 


hecho, los pastores tuvieron la puntuacion tnits 
alta (5.3), seguidos de los coordinadores edu- 
cativos de la iglesia (4.9). macstros (4.7), adul- 
tos (4.6) y jdvenes (4.1) —cada grupo en orden 
rcspectivo obtuvo califtcaciones menores en 
tdrminos significativos a los otros. En segundo 
lugar, las califtcaciones dc los pastores para la 
madurez de la fe dc 123 miembros de la con¬ 
gregation en una escala de 1 a 10 se co- 
rrelacionaron dc manera baslante sustancial 
(r = .61) con las punluaciones cn la FMS de 
esas personas, lo cual indica una corrcsponden- 
cia entre las califtcaciones independientes de 
un experto y el autoinforme. La escala lambidn 
reveld utilidad predictiva. En tdrminos espeef- 
ftcos, las califtcaciones dc escala de la FMS 
se relacionaron en gran medtda con una varie- 
dad de conductas prosociales como donar tiem¬ 
po para ayudar a los pobres, hambrientos o 
enfermos; promover un papel mds importante 
para las mujercs dentro dc la iglesia; y respal- 
darel uso de la polftica exterior para desaftar la 
segregacidn racial. 

Una advertencia es que la susccptibilidad 
de la escala a la propensidn de las rcspucstas 
(p. ej., “fingirse bueno") simplemcnte sc des- 
conoce. Los autores de la prueba demandan una 
mayor investigacidn para examinar diversas 
propensioncs dc rcspucsta, como responder 
sienipre sf y dar una apariencia socialmente 
deseable. Tambidn presentan una modestia re- 
frcscante al afirmar acerca de su prueba dc 38 
reactivos: 

Sena presuntuoso afirmar que estos 38 reactivos 
son la ultima paiabra acerca de lo que define la 
fe madura. Esperantos que, a medida que pase 
el tiempo, la Escala de madurez de la fe tambidn 
madure por medio de mayor informacidn y mo- 
dificacidn a travds de la interaccidn con un ex- 
tenso rango de investigadores y personas 
evaluadas que representen a un circulo cada vez 
mas extenso de tradiciones religiosas (Benson y 
col., 1993, p. 24) 

En general, la FMS reprcscnla una gran pro¬ 
mesa como medida de la madurez de la fe. 
Una virtud especial de la prueba es que evita 
el cfectode limite superior tan comun cn otras 
medtdas de las variables espirituales. Esta 
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caractcristica garantiza que el instmmento re- 
sulte util en cl cxamen de los efectos de los pro- 
gramas educalivos, asf como de los cambios a 
lo largo del tiempo cn individuos dcvotos. 

INDICE DE LA EXPERIENCE ESPIRITUAL 

Las rrvcdidas del funcionamicnto espiritual y 
religioso se han desarrollado principalmcntc a 
partirdc una interpretation cristiana de la fe. con 
el resultado de que las aplicaciones no pucdcn 
cxtendersc a personas cuyas crecncias religio- 
sas estdn enraizadas en otra idcologfa. Una no¬ 
table excepcidn cs el Spiritual Experience Index 
(SEI; Indice de experiencia espiritual), que sc 
oblicnc de una pcrspccliva del desarrollo de 
la fc. Esta prueba sc basa cn la teoria de que la 
fe es un fendmeno evolutivo que progresa 
de la religiosidad altamente cgoccnlrica de la 
infancia a la fe trasccndente de la adultcz me¬ 
dia —cuando la nutren condiciones psicoso- 
ciales favorables. Fowler (1981) fueel primero 
en dilucidar la tcorfa asociada con el desarro- 
lloy despuds Genia (1990) la revisd. En cl cua- 
dro 12-11 se presenta un resumen de las cinco 
ctapas de la fc segun Genia. 

Este nivel mis elevado de madurez religio- 
sa (que sc cncucntra cn todas las religiones prin- 
cipales) sc caractcriza por 10 criterios (Genia, 
1993b): 

1. Rclacidn trasccndente con algo mayor que 
uno mismo. 

2. Consistcncia del cstilo de vida y conducta 
con los valores espiritualcs. 

3. Compromiso sin cerlidumbre absoluta. 

4. Apertura a puntos de vista espiritualmcntc 
diversos. 

5. Ausencia de pensamiento magico y de con- 
ceptos antropomdrficos de Dios. 

6. Inclusion de componcntcs lanio racionalcs 
como cmocionalcs. 

7. Intcrds social y prcocupacidn humanitaria. 

8. La fc madura mejora la vida y alienta cl 
crecimiento. 

9. Suministro de significado y propdsito en la 
vida. 


Cuadro 12-11. Etapas de la fe religiosa 

Etapa 1. Fe egocdntrica 

Caracterislica de las personas con un desarrollo 
inmaduro de la personalidad, la fe egocdntrica es 
narcisista y se basa en la recompense o castigo 
anticipados. La imagen divina es anlropomdrfica 
y la oracidn tiene propositos de pelicibn. 

Etapa 2. Fe dogmdtica 

El dogma religioso se uliliza de manera rigida y 
defensive como medio de apoyo psicologico. Las 
escrituras se interprelan de modo literal y absoluto. 
La oracidn puede asumir la forma de convenio 
con Dios. 

Etapa 3. Fe de transicidn 

Caracterislica de muchos adolescentes, el indivi- 
duo reconoce una libertad para cuestionar y tenar 
dudas. Puede ocurrir experimentacidn religiosa 
como “probar" diferentes ideologias o cambiar de 
denominacibn. 

Etapa 4. Fe reconstruida intemalizada 

Existe un compromiso con una fe elegida por uno 
mismo que trasdende preocupaciones egoebn- 
tricas. La ideologia elegida proporciona una 
sensacidn de propdsito y significado en la vida. 
La doctrina religiosa es mbs compleja y la oracidn 
presenta agradecimiento. alabanza y devocidn. 

Etapa 5. Fe trascendente 

El individuo mantiene una relacidn trascendente 
con algo mas grande que dl mismo. Existe un 
compromiso sin cerlidumbre absoluta y el estilo 
de vida de la persona es consistenle con sus va¬ 
lores religiosos. 


Fuenle: Basado en Genia, V. (1990) Religious development A 
synthesis and relormuiatlon. Journal ot Rohgion and Health, 29, 
85-99 

10. Falta dc dcpcndcncia en prbcticas particu- 
lares o estruclura religiosa formal. 

El propdsito de la escala SEI consiste cn eva- 
luar cl grado de madurez espiritual (conccbida 
como un construclo unidimensional) para las 
personas dc diversas tradiciones religiosas y 
espiritualcs. Los reactivos de la eseala sc desa- 
rrollaron a parttr dc cstos 10 criterios por me¬ 
dio de una construccidn de escala racional (lo 
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dial signifies que la autora de la prueba disefid 
varios rcactivos pertinentes para cada uno dc 
|os criterios). Una muestra dc pilotco con 75 
personas (40% catdlicos romanos, 28% protes- 
lantes, 23% judios y 9% sin afiliacidn rcligio- 
sa) respondid a una escala preliminar de 50 
feactivos. Se eliminaron 12 rcactivos debido a 
la baja correlation reactivo-total, lo cual dejd 
una escala dc 38 rcactivos. 

Ejemplos dc rcactivos similarcs a los del 
SEI incluyen los siguientes: 

• Mi I'c me proporciona significado y propdsi- 
to cn la vida. 

• En general un dilema moral sdlo ticnc una 
solucidn corrects. (Calificacidn en dircccidn 
inversa.) 

•Sicnto una fuertc conexidn cspiritual con toda 
la humanidad. 

• Mi fc me ayuda a enfrentar la tragedia y cl 
sufrimiento. 

El formato de los rcactivos es una escala tipo 
Likert de seis puntos desde 1 = fuertemente en 
desacuerdo. hasta 6 = fuertemente dc acuerdo. 
La calificacidn sc presents coma la puntuacidn 
total natural con un rango de 38 a 228. Para la 
muestra inicial, las puntuaciones formaron una 
distribucidn normal que iba de 103 a 211, con 
una media de 166. 

Sc informa que la consistencia interna del 
SEI es de .87 (cocficicnte alfa), pero no sc cvalud 
la estabilidad test-retest. Cuando los 38 reac- 
tivos se sometieron a un An&lisis de Factoriza- 


I i RESUMEN _ 

1. Un valor es una creencia compartida y du- 
radera acerca dc los modos ideales de con¬ 
ducts o estados meta de la existcncia. La 
evaluation dc los valores es importante por- 
que dstos persuaden a la accidn, moldean 
actitudcs y gufan los esfuerzos para influir 
en los demds. 

2. Uno de los primeros inventarios para eva- 
luar los valores fue el Estudio de Valores, 


cidn dc Ejcs dc Principios, la escala sc mantu- 

vo como un constructo unidimensionai_no 

surgicron factores que explicaran una parte sig- 
niftcativa dc la varianza. Por tanto, las conclu- 
sioncs indican una buena confiabilidad interna 
para el SEI y sustentan su utilization como 
medida unidimensionai. 

La inspeccidn de la validez consistid cn una- 
lisis dc corrclaci6n con una variedad dc olras 
pruebas y medidas. Sc cncontraron fuertes co- 
rrclaciones con diversas variables: dogmatismo 
(r = -.52), lo cual indica que las puntuaciones 
alias cn la escala sc asocian con bajo dogma¬ 
tismo; puntuaciones dc Busqueda (r =.44), que 
sugieren que la escala incluyc aspcclos de 
complejidad y duda; religiosidad intrfnseca 
(r =.43), lo cual indica que la fuerte experien- 
cia espiritual promuevc una fe religiosa madu- 
ra; intolerancia de la ambigtiedad (r = -.40), lo 
cual expresa que la fuerte cxpcricncia espiri¬ 
tual permite la tolerancia dc la ambigUedad; y 
frecuencia dc la vencraci6n (r = .24), lo cual es 
fascinante ya que ninguno dc los rcactivos de 
la SEI ticnc que ver con este indite conductual 
de la fc. 

En general, eslos datos prestan sustentacion 
a la confiabilidad y validez de la escala, pero 
se neccsita de investigacidn adicional para 
examinar sus propiedades psicometricas. Es 
particularmentc dcscablc un mayor andlisis, en 
especial ya que cl SEI ocupa un nicho espe¬ 
cial cn la evaluacidn de las variables espiritua- 
les —es una dc las pocas escalas que puede 
aplicarse entre diversas tradicioncs rcligiosas. 


una prueba que consistia cn 30 preguntas 
que contraponen un valor con otro y 15 
preguntas que implican la clasificacidn dc 
valores. Esta escala produjo un inventario 
dc seis valores: Tedricos, Economicos, Es- 
teticos, Sociales, Politicos y Religiosos. 

3. El Rokeuch Value Surx’ey es otra herramienta 
para medir los valores. Esta prueba define y 
midc dos tipos de valores: instrumentalcs 
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(p. ej., Ambicioso, Imaginalivo, Tolcrantc) 
y terminates (p.cj., una vida edmoda, ar- 
monfa interna, una vida emocionante). 

4. En la Moral Judgement Scale dc Kohlbcrg, 
a la persona evaluada se le hace una seric 
de preguntas estructuradas relacionadas con 
varios dilemas morales. Las respuestas sc 
categorizan segun seis etapas y trcs nivclcs 
de desarrollo: preconvencional, convcncio- 
nal y posconvcncional. 

5. La Defining Issues Test(DIT) de Rest es un 
derivado dc la Escala dc juicio moral que 
utiliza un formato dc calificacidn comple- 
tamente objetivo. La prueba produce varios 
Indices cuuntitativos, incluyendo la puntua- 
cidn P (porcentajc dc razonamiento de prin¬ 
cipios) y el fndice N2 (basado en formulas 
complejas), ambos mucstran buena confia- 
bilidad y validez. 

6. Un drea relativamentc dcscuidada cn la eva- 
luacidn cs la valoracidn de las dimensiones 
espiritual y rcligiosa. Rsto cs desafortuna- 
do ya que la evaluacidn de cstas variables 
puede tener importantes implicacioncs para 
los clientes individualcs. 

7. Una dc las primeras formas de evaluacidn 
religiosa fue la Allport-Ross Religious Orien¬ 
tation scales. Estas escalas popularizaron los 
conceptos de religiosidad intrinscca (las per¬ 
sonas viven su religidn para encontrar sig- 
nificado y dircccidn) contra religiosidad 
extrfnseca (las personas utilizan su religidn 
para buscar seguridad o cstatus). 


8, La escala Quest (Busqueda) pretendc medir 
una tcrccra orientacidn religiosa (mds alia 
de la intrfnscca y extrfnseca) que se carac- 
teriza por la complejidad, duda y vacilacidn 
como mancras de ser religioso. Esta sen- 
cilia escala dc 12 rcactivos parcce tnedir 
una religidn de mcnos fe, pero mayor es- 
fuerzo. 

9. La Spiritual Well-Being Scale cs uno de los 
pilares en el campo de la evaluacidn reli¬ 
giosa. Consistc de dos subescalas: Bicncs- 
tar religioso (una dimensidn vertical dc 
bienestaren rclacidn con Dios) y Bienestar 
cxistcncial (una dimensidn horizontal de 
bienestar cn relacidn con el propdsito y la 
satisfaccidn cn la vida). Un problems con 
esta escala es su bajo nivel superior. 

10. El Faith Maturity Index es una ambiciosa 
escala diseftada por instruccioncs dc seis 
de las principalcs denominaciones protes- 
lantes. Los 38 reactivos sc responden en 
una escala de siete puntos, lo cual propor- 
ciona un fndice de una fe activa y transfor- 
madora de la vida, como la comprenden las 
principales iglesias protestantes. 

11. El Spiritual Experience Index sc disefid para 
medir la madurez espiritual a partir de una 
perspectiva evolutiva de la fe, independiente 
dc cualquiercredo o religion particular. Los 
38 rcactivos se responden cn una escala de 
seis puntos, lo cual produce un fndice um- 
tario de la madurez espiritual ampliamente 
definida. 
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Personalidad: perspectiva general 
Teorfas psicoanaKticas de la personalidad 
Teorlas de tipos de personalidad 
Teorlas fenomenolbgicas de la personalidad 
Teorias conducluales y del aprendizaje social 
Conceptos sobre rasgos de personalidad 
Resumen 

Tbrminos y conceptos clave 







En las pruebas psigolbgicas, con frecuen- 
cia se establece una distincibn fundamental 
entre las pruebas de capacidad y las de pcrso- 
nalidad. Dcfinidas en el sentido mbs amplio, 
las pruebas de capacidad incluycn la plbtora de 
instrumentos para mcdir inteligencia, aprove- 
chamiento, aptitud y funciones neuropsicolb- 
gicas. En los 12 capftulos anteriores se ha 
explorado la naturaleza, construccibn, aplica- 


cibn, confiabilidad y validez de eslos instrumen¬ 
tos, mientras que en los siguientes dos capftu¬ 
los se cambia el enfasis hacia las pruebas de 
personalidad. festas miden uno o mbs de los 
siguientes aspectos: rasgos de personalidad, 
motivacibn dinamica, adaptacibn personal, 
sintomatologfa psiquibtrica, habilidades socia- 
les y caracterfsticas actitudinales. Estc capftulo 
invcstiga los ongenes de las pruebas de perso- 
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nahdad. En cl tcma 13A, Teorfas y medicidn de 
la personalidad, sc cstudian las difcrentcs ma- 
ncras cn que los invcstigadores han conceptua- 
do la personalidad para ilustrar la forma cn que 
sus teorfas han impactado al diseno dc las prue- 
bas y evaluaciones dc la personalidad. En cl tema 
13B, Tdcnicas proyectivas, sc analiza la multi- 
plicidad de inslrumentos basados en la hipdte- 
sis psicoanalftica de inicios del siglo XX dc que 
las respucstas a eslfmulos ambiguos revelan los 
procesos mcntales mds internos, inconscicn- 
(cs, dc la persona examinada. En cl siguiente 
capilulo prosigue la cobertura dc la cvaluacidn 
dc la personalidad con una revisidn dc las pruc- 
bas y proccdimientos objetivos, incluycndo los 
inventarios de autoinforme y los enfoques de 
cvaluacidn conduclual. 


PERSONALIDAD: PERSPECTIVA 
v GENERAL 

Aunquc cs diffcil definir la personalidad, sc 
puede distinguir dos caractcrfsticas fundamcn- 
talcs de estc constructo vago. Primcro, cada 
persona es consistcnte en cierto grado; se tic- 
nen rasgos y patrones de accidn cohercntes 
que surgen de manera repetida. En segundo 
lugar, cada persona cs dislintiva hasta cierto 
punto; existen diferencias conductuales entre 
los individuos. Considdrcnsc las reaccioncs dc 
tres estudiantes dc posgrado cuando sc les en- 
tregaron sus cxdmcnes dc mitad del curso. Aun¬ 
quc los tres estudiantes recibicron calificacioncs 
casi iddnticas (B), sus reaccioncs personates 
fucron bastantc diversas. El primer esludiante 
sc marchd malhumorado y despuds se le escu- 
cho decir que serfa adecuado poner una queja 
con cl administrador del departamento. El se¬ 
gundo se moslrd complacido, afirmando en voz 
alta que B era, despuds dc todo, una califica- 
cidn rcspctable. El terccro se sintid decepcio- 
nado, pero sc mostrd estoico. Sc culpd a sf 
mismo por no estudiar con mds ahfnco. 

^C<5mo sc han de entender las diferentes 
reacciones dc estas personas, cada una de las 
cuales respondia a un cstfmulo iddntico? Psi- 


cdlogos y legos por igual invocan cl concepto 
de personalidad para explicar la conducta y 
los sentimientos expresados por otros. Este con¬ 
cepto se utiliza para explicar las diferencias 
conductuales entre personas (por ejemplo, por 
qud uno se queja y otro se mucslrn estoico) y 
para comprendcr la consistcncia dentro de cada 
individuo (por ejemplo, por qud el cstudiantc 
quejoso de quicn sc habld antes cn general se 
mostraba amargado e insatisfccho). 

Ademds dc comprcnder la personalidad, los 
psicdlogos tambidn intentan mcdirla. Lileral- 
mente cientos de pmebas de personalidad cs- 
Uin disponibles para estc propdsito; aquf sc 
revisardn inslrumentos histdricamcnlc dcstaca- 
dos y tambidn se analizardn algunos nuevos 
enfoques promctedorcs. No obstante, a fin de 
que el lector pueda comprender mejor la di- 
versidad dc inslrumentos y enfoques, sc comen- 
zard con una pregunta fundamental: ^C6mo 
puede conccptuarsc mejor a la personalidad? 
Como descubrird el lector, cuando se quicre 
medir la personalidad, primcro debe preversc 
qud es lo que sc busca medir. El lector aprecia- 
rd mejor la multiplicidad de pruebas y proce- 
dimientos si tambidn sc describcn dc manera 
breve las teorfas de personalidad que forman 
los fundamentos para estos instrumentos. Se 
cierra este tcma con una pregunta general rc- 
lacionada con todas las teorfas y enfoques de 
pruebas: /.Qud tan establc y predecible cs la 
conducta? 

Aunquc se separan las pruebas de perso¬ 
nalidad dc las dc capacidad, la distincidn entre 
ambos tipos dc instrumento estd lejos de scr 
absoluta. La capacidad intelectual es, en parte, 
un rasgo caractcroldgico basado en atributos 
como perseverancia y autocontrol. Asf, las prue¬ 
bas de capacidad tocan inevitablemente impor- 
tantes dimensiones de personalidad, aunquc de 
manera indirccta e imperfecta. Con frccuencia 
tambidn ocurre lo contrario; las pruebas de per¬ 
sonalidad pueden estar saturadas de factores de 
capacidad. Por ejemplo, es probable que cier- 
tas dimensiones de la personalidad, como la 
apertura a la cxperiencia, se corrclacionen en 
sentido positivo con la inteligcncia. Como el 
lector descubrirS en el siguiente capftulo, algu- 
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nos inventarios dc personalidad con respuestas 
de cierto-falso incorporan un muy robusto 
factor de inteligencia (p. ej., Cattell, Eber y 
Tatsuoka, 1970). 


I TEORfAS PSICOANALfTICAS 
DE LA PERSONAUDAD 


El psicoandlisis fue la creacidn original dc 
Sigmund Freud (1856-1939). Aunque es cierto 
que muchos otros han revisado y adaptado sus 
teonas, los cambios han sido leves en compa- 
racidn con los fundamentos sustanciales que 
pueden encontrarse de este genio singular de la 
era victoriana y de inicios del siglo XX. Freud 
fue sumamente prolffico en sus escritos y teo- 
rfas. En este caso, se restringc este andlisis a 
unos cuantos aspectos del psicoandlisis que 
han influido en las pruebas psicoldgicas. En 
particular, el Rorschach, el Test de apercep- 
ci6n temiitica y la mayor parte de las pruebas 
proyectivas revisadas en el siguiente tema re- 
quieren de un esquema psicoanalftico para su 
interprctacidn. Los lectores que desccn una revi- 
sidn mds amplia dc las contribuciones de Freud 
pueden comenzar con Nucvas conferencias de 
introduccidn al psicoandlisis (Freud, 1933). 
Pueden encontrarse resenas e interpretaciones 
dc las teonas de Freud en Stafford-Clark (1971) 
y Fisher y Greenberg (1984). 

OftfGENES DE LA TEORfA 
PSICOANALITICA 

Freud comenzd su carrera profesional como 
ncurdlogo, pero pronto se especializd en cl tra- 
tamiento de la histeria, un trastomo emocional 
caracterizado por conducta histridnica y sfnto- 
mas ffsicos de origen psiquico como pardli- 
sis, ceguera y pdrdida de sensacidn. Junto con 
su colega Joseph Breuer, Freud postuld que la 
rafz causal dc la histeria eran las memorias se- 
pultadas de experiencias traumdticas como el 
abuso sexual en la infancia. Si estos recuerdos 
pudieran recuperarse bajo hipnosis, podrfa ocu- 


rrir una liberacidn de la emocidn llamada 
abreaccidn y los sfntomas ffsicos desaparecc- 
rfan, al menos por un breve liempo (Estudios 
sobre la histeria, Breuer y Freud, 1893-1895). 

A partir de estos primeros estudios, Freud 
desarrolld una teorfa general del funcionamien- 
to psicoldgico con el concepto dc inconsciente 
como su fundamento. Consideraba que el in¬ 
consciente era el depdsito de las pulsiones ins- 
tintivas y un almacdn de los pensamientos y 
dcscos que serfan inaceptables para nuestro yo 
consciente. Asf, Freud discutfa que nuestras 
motivaciones personales m.Ls importantes estan 
en gran medida mds alld de nuestra conscien- 
cia. El concepto de inconsciente se analizd con 
mayor dctalle en su primer libro (La Interpre- 
tacion dc los suerios, Freud. 1900). Freud crefa 
que los suehos representan nucstros motivos 
inconscientes en una forma disfrazada. Incluso 
un sueno en apariencia inocuo podrfa tener en 
realidad un significado sexual o agresivo ocul- 
to, si se le interprets dc mancra corrects. 

El concepto dc Freud acerca del inconscien¬ 
te penetrd hasta los mcros fundamentos de las 
pruebas psicoldgicas a principios del siglo XX. 
A partir de allf surgid una familia completa de 
tdcnicas proyectivas, incluyendo manchas de tin- 
ta, enfoques de asociacidn de palabras, tdc- 
nicas de Frases incompletas y dc narracidn de 
historias (apercepcidn) (Frank, 1939; 1948). 
Cada uno de dstos se basaba en la suposicidn 
de que los motivos inconscientes pueden discer- 
nirsc a partir de las respuestas de la persona 
examinada a estfmulos ambiguos y desestruc- 
turados. De hecho, Rorschach (1921) relaciond 
su prueba de manchas de tinta con una ra- 
diograffa de la mente inconsciente. Aunque exa- 
gerd de manera patente el poder de las tdcnicas 
proyectivas, queda evidente, desde la perspec- 
ti va de Rorschach, que la concepcidn psicoana- 
Iftica del inconsciente tuvo una fuerte influencia 
sobre las priicticas de evaluacidn. 

ESTRUCTURA DE LA MENTE 

Los puntos de vista de Freud acerca de la es- 
truclura dc la mente y la operacidn de los me- 
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canismos dc defcnsa tambidn influycron en las 
pruebas y evaluacidn en psicologfa (Nucvas 
conferencias de introduction al psicoansili- 
sis, Freud, 1933). Varias pruebas y enfoques de 
evaluacidn que se analizan en este capftulo se 
basan en el concepto psicoanalftico de los mc- 
canismos de defensa, de modo que este tema 
merece un resumen. 

Freud dividid a la mente en ires estructu- 
ras: ello, yo y superyd. El ello cs la parte os- 
cura c inacccsiblc dc nuestra personalidad que 
Freud vinculd con “un caos, una caldera llena 
de excitacioncs en cbullicidn". Debido a que cl 
ello es toialmente inconscicnte, sc deben infe- 
rir sus caracterfsticas de manera indirecta a tra- 
vds del andlisis de los sueiios y de sfntomas 
como la ansiedad. A partir de dicho analisis, 
Freud concluyd que el ello es el asiento de todas 
las neccsidades instintivascomo aquellas deco- 
mida, agua, gratificacidn sexual y evitacidn del 
dolor. El ello tiene un solo propdsito, obtener 
la satisfaccidn inmediata de estas necesida- 
des de acuerdo con el principio del placer. £ste 
cs el impulso hacia la satisfaccidn inmediata 
sin (omar en cuenta valores, bien o mal, o moral. 
El ello tambidn es incapaz de ldgica y no posec 
concepto de tiempo. Por tanto, los procesos 
mcntales cadticos del ello pcrmanccen inaltc- 
rables con el paso del tiempo y las impresiones 
que se han guardado en dste “son virtualmentc 
inmortales y se conservan durante ddcadas 
complctas como si hubieran ocurrido apenas" 
(Freud, 1933). 

Si nuestra personalidad consistiera sdlo de 
un ello que se esfuerza por gratificar sus inslin- 
tos sin tomar en cuenta la realidad, pronto se- 
rfamos aniquilados por las fuerzas extemas. Por 
fortuna, poco despuds del nacimiento, parte del 
ello evoluciona para formar un yo o sf mismo 
consciente. El propdsito del yo es mediar entre 
el ello y la realidad. El yo es parte y servidor 
del ello, pero "ha interpolado entre el deseo y 
la accidn el factor aplazadordel pensamiento”. 
(Freud, 1933). Asf, el yo es en gran medida 
consciente y obedece al principio de rcaiidad; 
busca maneras realistas y seguras de descargar 
las tensiones inslintivas que presionan constan- 
temente desdc el ello. 


El yo tambidn debe enfrentarse al superyd, 
el componente dtico de la personalidad que 
comienza a surgir en los primeros cinco arios 
de vida. £ste es casi un sindnimo de conscien- 
cia moral y comprende las normas socialcs dc lo 
que es correcto e incorrecto que nos trasmiten 
nuestros padres. El superyd es parcialmente 
consciente, pero gran parte de dl cs inconscien- 
te; es decir, no siempre se estd consciente de su 
cxistencia u operacidn. La funcidn del superyd 
cs rcstringir los intentos del ello y del yo de 
obtener gratificacidn. Su arma principal cs la 
culpa, la cual utiliza para castigar las malas ac- 
ciones del yo y del ello. Asf, no es suficiente 
que el yo cncucntre una manera segura y realis- 
ta para gratificar las neccsidades del ello; tambidn 
debe elegir una salida moralmentc accptable o 
sufrird el castigo de su supervisor, el superyd. 
Esto cxplica por qud uno puede sentirse culpa¬ 
ble de conducta inmoral como el robo, aun 
cuando es imposible que se le atrape. Otra par¬ 
te del superyd es cl ideal del yo, que consiste dc 
las metas y aspiraciones. El yo sc mide contra 
cl ideal del yo y lucha por satisfacer sus de- 
mandas de perfeccidn. Si el yo no logra satisfa¬ 
cer los cstdndares del ideal del yo, cl sentimiento 
de culpa puede ser el rcsultado. Por lo comun 
se interpreta esta culpa como sentimiento de 
inferioridad (Freud, 1933). 


PAPEL DE LOS MECANISMOS 
DE DEFENSA 

Con toda seguridad el yo enfrenta una (area di- 
ffcil al actuar como mediador y servidor de tres 
tiranos: el ello, el superyd y la rcaiidad externa. 
Al lector podrfa parecerle que la tarea serfs 
esencialmente imposible y que, por tanto, el in- 
dividuo se encontrarfa en un constantc estado 
de angustia. Por fortuna, el yo tiene a su dispo- 
sicidn una serie dc herramientas para ayudarse 
a llevar a cabo su trabajo; a saber, las estratc- 
gias mentalcs que dc manera colectiva se lla- 
man mccanismos de defensa. 

£stos tienen muchas variedades, pero to- 
dos compartcn ires caracterfsticas. Primero, su 
propdsito exclusivo es ayudar al yo a redueir la 
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ansiedad creada por las demandas conflictivas 
del cllo, superyd y realidad externa. De hecho, 
Freud consideraba que la ansiedad era una 
serial para que el yo invocara uno o mds meca- 
nismos de defensa en bcneficio propio. Por tan- 
to, los mecanismos de defensa y la ansiedad 
son conceptos complementarios en la teorfa 
psicoanalftica que existen el uno como con- 
irafuerza del otro. El segundo aspecto comun 
de estos mecanismos es que operan a nivel in- 
conscicnte. Asi, aunque cstdn bajo el control 
del yo. uno no estd conscicnte de su opcracidn. 
Su tercera caracteristica cs que distorsionan la 
realidad interna o externa. Esta propiedad es 
la que los capacita para reducir la ansiedad. Al 
permitir que el yo vea de manera menos ame- 
nazantc los desaffos del ello, del supery6 o de 
la realidad externa, los mecanismos de defensa 
le ayudan a evitar niveles incapacitantes de an¬ 
siedad. Por supuesto, debido a que los meca¬ 
nismos de defensa distorsionan la realidad, su 
aplicacidn rfgida y excesiva puede crcar mds 
problcmas de los que resuelve. 

evaluaci6n de los mecanismos de 

DEFENSA Y DE LAS FUNCIONES DEL YO 

Aunque Freud introdujo cl concepto de mecanis¬ 
mos de defensa, sus seguidores fueron quienes 
dilucidaron en mayor detalle estas estrategias 
mentales inconscientcs (Paulhus, Fridhandlcr 
& Hayes, 1997). Una de las primeras descrip- 
cioncs de los mecanismos de defensa la pro- 
porciond la hija de Freud, Anna (El yo y los 
mecanismos de defensa, A. Freud, 1946). No 
obstante, la aplicacidn de estos conceptos a la 
medicidn y evaluacidn psicoldgicas es mucho 
mds reciente. Por cjemplo, Loevinger (1976, 
1979, 1984) ha producido una tdcnica de Fra- 
ses incompletas para medirel desarrollo del yo 
que sc basa, de manera indirecta, en el andlisis 
de los mecanismos de defensa. En el siguientc 
tema se describe este interesante enfoque de la 
medicidn de la pcrsonalidad. Aquf sc presenta- 
rdel trabajo de Vaillant (1977, 1992) para ilus- 
frar la medicidn de los mecanismos de defensa 
y la aplicacidn de esta informacidn para la com- 
prensi6n de la personalidad. 


Vaillant (1971) desarrolld una jerarqufa de 
mecanismos adaptativos del yo basada en la 
suposicidn de que algunos mecanismos de de¬ 
fensa son mds sanos que otros. Desde esta pers- 
pcctiva, los mecanismos de defensa pueden 
agruparse en cuatro tipos diferentes. Listados 
en orden de mcnor a mayor salud, los tipos son: 
psicdticos, inmaduros, neurdticos y maduros 
(cuadro 13-1). Los mecanismos psicdticos, 
como la negacidn absoluta de la realidad exter¬ 
na, son los menos sanos porque distorsionan la 
realidad en grado extremo. Al observador le 
parecen "locos”. Los mecanismos de defensa 
inmaduros, como la proyccci6n hacia otras per¬ 
sonas de los propios sentimientos no reconoci- 
dos, son mds sanos que los mecanismos 
psicdticos. No obstante, los observadores ex- 
temos los detectan con facilidad y las conside- 
ran indescabies. Los mecanismos neurdticos de 
defensa por lo comun alteran sentimientos pri- 
vados, de modo que son menos amenazantes. 
Un cjemplo de csto es la intelectualizacidn, un 
mecanismo de defensa en el que las cucstiones 
amenazantes se analizan en terminos anodinos, 
vaefos de sentimiento. Porejemplo, un mddico 
cuya madre ha muerto rccientemente podrfa 
hablar en gran detalle acerca de las caracteris- 
ticas mddicas del edneer que dsta sufrid, con lo 
cual alivia su propio sentimiento de pdrdida. 
Los mecanismos maduros de defensa al obser¬ 
vador le parecen como virtudes convenicntes. 
Un cjemplo lo constituyen cicrtas formas de 
sentido del humor que no distorsionan la reali¬ 
dad pero que pueden aliviar la carga de asuntos 
“demasiado terribles como para tolcrarlos" 
(Vaillant, 1977). 

En el Estudio Grant se ilustra la aplicacidn de 
los mecanismos de defensa a la comprensidn 
de la personalidad, un estudio de seguimieniocon 
una duracidn de 45 afios que condujeron Vaillant 
y otros colaboradores (Vaillant. 1977; Vaillant y 
Vaillant, 1990). Estos investigadores utilizaron 
entrevistas eslructuradas para obtener eviden¬ 
ce de las mecanismos adaptativos inconscientcs 
en una muestra de 95 varones. Los individuos 
provenfan de una muestra original de 268 estu- 
diantes de las clases de 1939 a 1944 en la Uni- 
versidad de Harvard. En el seguimiento, Vaillant 
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Cuadro 13-1. Niveles de los mecanismos de defense propuestos 

por Vaillant (1977) 


I. Psicbtico 

Proyeccibn delirante: francos deiirios acorca de la realidad externa, en general de naturaleza 
persecutors. 

Negacibn: negacibn de la realidad externa; p. e|„ (alia en reconocer que se tiene una enfermedad 
terminal. 

Distorsibn: notoria reeslrucluracibn de la realidad externa para adecuarla a las necesldades intemas; 
p. ej., deiirios de cumplimiento del deseo. 

II. Inmaduro 

Proyeccibn: atribulr los propios senlimientos no reconocidos a otras personas; p. ej. "|Tu estbs 
enojado, no yo!” 

Fantasia esquizoide: uso de la fantasia y el retraimiento al interior con el propbsito de resolver 
conflictos y obtener gratilicacibn. 

Hipocondria: transformacibn del reproche hacia los dembs en autorreproche y despuos convertirlo 
en quejas de enfermedad fisica. 

Conducta Agresiva-Pasiva: agresibn hacia otros expresada indirecta e ineficazmente mediante 
pasividad o contra si mismo. 

Acting-out: expresibn directa de un deseo o impulso inconscientes a fin de evitar tener conciencia 
del sentimiento que les acompana. 

III. "Neurbtico" 

Intelectualizacibn: pensar sobre los deseos en tbrminos formates, insensibles, pero no actuar sobre 
ellos. 

Represibn; (alias de memoria aparentemente inexplicables o fracaso en reconocer cierta informacibn; 
p. ej., "olvidaf una cita con el dentista. 

Oesplazamiento: dirigir el sentimiento hacia algo o alguien que no es el objeto real; p. ej.. patear al 
perro porque se siente enojo hacia el jefe. 

Formacibn reactiva; cambiar de manera inconsciente un impulso en su contrario; p. ej., amabilidad 
exagerada hacia un compaftero de trabajo a quien se odia. 

Disoclacibn: modificacibn temporal, pero drbstica, del propio carbcter para evitar angustia emocional; 
p. ej., una actitud de “me importa poco* por breve tiempo. 

IV. Maduro 

Altruismo: servicio vicario, pero constructive y gratificante hacia los dembs; p. ej., filantropia. 

Sentido del humor reconocimiento alogro de ideas y sentimienlos sin incomodidad y sin causar 
efectos desagradables a los dembs; no incluye el sarcasmo. 

Supresibn: decisibn consciente o semiconsciente de posponer el prestar atencibn a un conflicto o 
impulso conscientes. 

Anticipacibn: anticipacibn realista o planilicacibn para cualquier Incomodidad interna future; p ej., 
anticipacibn realista de una cirugia o una separacibn. 

Sublimacibn: expresibn indirecta de los deseos instintivos sin consecuencias adversas o perdida 
del placer; p. ej., canalizar la agresibn hacia los deportes. 


Puente: Bas-ado on Vaillant. G. (1977). Adaptation to We: How the best and the brightest came ol ago Boston, MA: Little. Brown. 
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entrcvistd a cada uno dc los participants du¬ 
rante dos horas, utilizando un protocolo dc 
entrevista scmiestruclurada (Vaillant, 1977, 
Apdndicc B). Adenitis, los participantes Ilena- 
ron cuestionarios autobiogrdficos y proporcio- 
naron otras fuentes de informacidn. Vaillant y 
otros calificadores evaluaron los datos comple¬ 
tes dc cada persona segun cl grado en que cada 
mecanismo de defensa caracterizaba su adap¬ 
tation vital. Los mecanismos dc defensa sc 
calificaron dc 1 (ausente) a 5 (principal). A con- 
tinuacidn se presenta un ejcmplo de un meca- 
nisnio adaptativo inconsciente: 

Un hematdlogo de Calilomia desarrolto el pasa- 
tiempo de cultivar cdlutas vivas on tubos de en- 
sayo. En una entrevista reclente, describe) con 
interns y animacidn especiales un cultivo 
inusualmente interosanto que habfa obtenido de 
una biopsia de tejido proveniente de su madre. 
Sdto hacia el final de la entrevista reveld como 
por casualidad que su madre habfa rnuerto de 
una embolia apenas tres semanas antes. Su 
mencton acerca de la muerte de su madre lue 
tan Indtlerente como su descripcton acerca de 
o6mo habfa logrado tenir de manera oficaz su 
cuilivo de tejido aun vivo. De modo Ingenioso e 
inconsciente, habfa utlllzado su pasatiempo y sus 
habilidades especiales como mddico para miti- 
gar en forma temporal el dolor por su pdrdtda. 
Aunque su madre ya no estaba viva, at cambiar 
su a tone ton todavfa podia cuidarla. No habfa nada 
rnorbido en la manera en que contaba la historia; 
y debido a que los mecanismos del yo son in- 
conscientes, no tenfa Idea de su conducts de- 
lensiva. Muchos de los varones mds sanos 
dentro del Estudio utilizaban llpos similares de 
cambios de atencton o desplazamiento. A mo¬ 
nos de que un observador entrenado la exa¬ 
mine, dicha conducta pasa desapercibfda la ma¬ 
yor parte de las veces (Vaillant, 1977). 

Es muy probable que cstc individuo recibiera 
una calificacidn de 5 (principal) para el mecanis- 
tno dc defensa neurdtico de desplazamiento. 

Si se toma en consideracidn el grado de 
juicio calificado que requerfa la tarea de eva¬ 
luation, la confiabilidad intercalificadores para 
los mecanismos de defensa fue —con unas 
cuantas excepciones— rcspetable. Los meca¬ 
nismos de defensa individuals posefan 
confiabilidades que iban de .53 (Fantasia) a .96 
(Proyeccidn); la mayor parte de las confiabili¬ 


dades estaban en los rangos dc .70 y .80. La 
confiabilidad de las calificaciones globalcs (que 
reflejaban la proporcidn de calificaciones dc 
madurez a inmadurez) fue de .77. 

La validez de las calificaciones para los 
mecanismos de defensa depende en gran medi- 
da de la demostracidn dc que los cambios rela- 
cionados con cl dcsarrollo y las difercneias 
grupales son consistentes con la teorfa psicoana- 
Iftica en cuanto a estos constructos. Por ejem- 
plo, sc esperarfa que los individuos del Estudio 
Grant utilizaran rnenos mecanismos dc defensa 
inmaduros y mas maduros a medida que alcan- 
zaran la medians edad y esto es precisamente 
lo que descubrid Vaillant. Adcmds, se espera- 
rfa que las personas consideradas inadaptadas 
con base en otros criterios (p. ej., divorcio 
frecuentc, desempeno deficiente) tuvieran ca- 
lificacioncs menos favorables en mecanismos 
de defensa en comparacidn con personas adap- 
tadas, y esto tambidn lo observd Vaillant. En 
suma, cl andlisis de los mecanismos dc defensa 
es un enfoque prometedor para la evaluacidn 
de la personalidad. No obstante, este enfoque 
tiene dos inconvenientes: el examinador nece- 
sita entrenamiento especializado para rccono- 
cer los mecanismos de defensa y el proceso de 
obtencidn dc la informacidn pertinente de par¬ 
te de los individuos examinados requiere mu- 
cho tiempo. 

I TEORIAS DE TIPOS DE 
PERSONAUDAD 


Las primeras teorfas de personalidad intenta- 
ban clasificar a las individuos en categorfas 
separadas o tipos. Por ejemplo, el mddico grie- 
go Hipocrates (aproximadamente 460-377 a.C.) 
propuso una teorfa sobre humores con cuatro 
tipos dc personalidad (sangufneo, coldrico, 
melancdlico y flcmdtico), que era demasiado 
simplista como para ser dtil. En el decenio de 
1940, Sheldon y Stevens (1942) propusicron 
una teorfa de tipos basada en la relacidn entre 
cstructura corporal y temperamento. Su enfo¬ 
que provoed una conmocidn en la investigacidn 
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y despuds se desvanecid en el olvido. Sin em¬ 
bargo, las teorfas tipoldgicas ban continuado 
captando interds intermilente de parte dc los in- 
vestigadores de la personalidad. Se iluslrarln las 
tconas dc tipo al revisar la investigacidn actual 
acerca de los lipos de personalidad con pro- 
pensidn a la cardiopatfa. 

patr6n conductual tipo a , con 

PROPENSI6N A LA CARDIOPATIA 

Friedman y Rosenman (1974) invcstigaron las 
variables psicoldgicas quc colocaban a los in- 
dividuos en mayor riesgo de cardiopatfa 
coronaria. Fueron los primeros cn identificar 
un Patrdn conductual Tipo A con propcn- 
sion a la cardiopatia. que describieron como 
un “complejo accidn-cmocidn que puede ob- 
servarse en cualquier persona que participa dc 
mancra agresiva en una lucha crdnica, incesan- 
te, para lograr cada vez mis en mcnor tiempo y 
que, si se ncccsita, lo hace en contra dc los es- 
fuerzos opuestos de parte dc otras cosas o per¬ 
sonas" (Friedman y Rosenman, 1974). En el 
otro extremo se cncuentra el patrdn conductual 
Tipo B, que se describe como un tipo de vida 
despreocupado, no competitivo y relajado. Por 
supuesto, las personas varfan a lo largo de un 
continuo dcsde cl Tipo A “puro” hasta el Tipo 
B “puro". 

Friedman y Ulmer (1984) han listado los 
componcntes especfficos de un pairdn conduc¬ 
tual Tipo A completo: 

• Inscguridnd acerca del estatus: muchas per¬ 
sonas Tipo A parecen estar afligidas por una 
oculta falta de autoestima. No importa qud 
tan exitosas scan, con frecuencia se com- 
paran de manera dcsfavorable con otras per¬ 
sonas con logros altos. 

• Hiperagresividad: parte deeste pairdn locons- 
tituye un deseo dc dominar a los dcmds y da- 
ftar su autoestima. Con frecuencia, las perso¬ 
nas Tipo A se muestran indiferentes a los sen- 
timicntos o derechos de sus competidores. 

• Hostilidad libre flotante: la persona Tipo A 
tienc muchas cosas por las cuales molestarse 


y el enojo cstl fuera de proporcidn con la 
siluacidn. 

• Sentido de urgencia de tiempo (enfernre- 
dad de la prisa): csto incluye dos estratage- 
mas blsicas: acclerar las actividades diarias 
(juna persona Tipo A utilizaba una rasuradora 
cldctrica en cada mano!) y hacer dos cosas a 
la vez, como convcrsar por teldfono niicntras 
se revisa la corrcspondencia. 

La conducta Tipo A puede diagnosticarse a 
partir dc una breve entrevista que consiste de 
preguntas acerca de hlbitos para trabajar, ha- 
blar, comer, leer y pensar (Friedman y Ulmer, 
1984). Tambidn pueden deiectarse los casos mis 
evidentes de conducta Tipo A a travds de prue- 
bas dc llpiz y papcl (Jackson y Gray, 1987; 
Jenkins, Zyzanski y Rosenman, 1971,1979) que 
se analizarln cn el siguiente capftulo. No obstan¬ 
te, el enfoque de cuestionario es limitado, dc- 
bido a que no puede revclar los Indices faciales, 
vocales y psicomotores de hostilidad y uigcn- 
cia de tiempo que por lo general son evidentes 
en la entrevista (Friedman y Ulmer, 1984). 

Los primeros cstudios indicaron que las 
personas quc exhibfan el Patrdn Conductual 
Tipo A estaban en mucho mayor riesgo de su- 
frir cardiopatfa coronaria e infarto al miocardio. 
En un estudio de nueve ados con mis dc 3 000 
varones sanos, las personas con patrdn conduc¬ 
tual Tipo A estaban en una probabilidad 2.5 
veces mayor de sufrir un infarto que aqudllos 
con un pairdn conductual Tipo B (Friedman y 
Ulmer, 1984). De hecho, ninguno de los indi- 
viduos con Tipo B "puro" —aquellos miembros 
del estudio que cran muy relajados. despreocu- 
pados y no compclitivos— sufrid un infarto. En 
el famoso estudio longitudinal Framingham, los 
varones Tipo A entre 55 y 64 anos de edad 
mostraron una probabilidad dos veces mayor 
de desarrollar cardiopatia, al momento del se- 
guimiento a los 10 ados, que aqudllos del Tipo 
B (Haynes, Feinleib y Eaker, 1983). En este es¬ 
tudio, la vinculacidn entre la conducta Tipo A 
y la cardiopatfa fuc espccialmente fuertc entre 
trabajadores no obreros. 

En estudios mas recientes, los investiga- 
dores han encontrado sdlo una relacidn leve 
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—o ninguna relation en absoluto— entre la 
conducta Tipo A y la cardiopatfa coronaria (p. 
cj., Eakcr y Castclli, 1988; Mathews y Haynes. 
1986). Otros investigadores han encontrado 
quc la cardiopatia no sc liga tanto con el pa- 
trOn conductual Tipo A completo como con sus 
componentes especfficos, como la propensiOn 
al enojo (Dembroski, MacDougall, Williams y 
Haney. 1985). Seguramente, exisle la neccsi- 
dad de clasificar los factorcs especfficos de ries- 
go en esta drea de investigation. En Brannon y 
Feist (1992) y Wiebe y Smith (1997) pueden 
encontrarse buenas revisiones acerca de la 
complcja y confusa investigation sobre la con¬ 
ducta Tipo A. 

La investigation sobre la conducta Tipo A 
ha despertado un interds renovado y mds com- 
plejo hacia los conceptos tipolOgicos de la per¬ 
sonalidad. En vez dc ver los lipos como casillas 
separadas, los psicOlogos han llcgado a consi- 
derarlos como ejemplos idealizados quc ocu- 
pan los puntos terminales de dimensiones 
continuas. Asf, los individuos pueden diferir con 
respecto a qud tanto posccn de un tipo dc per¬ 
sonalidad idealizado. Esto es similar al concepto 
de rasgos de personalidad que se analiza des¬ 
puds. Quizd la diferencia principal es que, en la 
actualidad, los tebricos de los tipos tienden a 
creer que la mayorfa de los individuos se en- 
cuentran cerca dc los tipos idealizados al final 
de cada dimension, mientras quc los tebricos de 
los rasgos afirman que es mbs probable quc las 
personas se coloquen en todos los puntos a lo 
largo dc cada continuo dc personalidad. Por 
tanto, en la prdctica, la distincibn moderna en¬ 
tre lipos y rasgos es relativa, no absoluta. 


tcncialcs, dc constructo, del sf mismo y dc rea¬ 
lization (Maddi, 1989). Sin embargo, estos en- 
foques comparten la atencibn quc dirigen a la 
experiencia subjetiva dc la persona, la perspecti¬ 
ve personal acerca del mundo y el autoconcepto 
como fuentes principales de la conducta. 

ORIGENES DEL ENFOQUE 
FENOMENOL6GICO 

La orientacibn que se revisa de manera breve 
en esta seccibn tiene numerosas fuentes que be¬ 
gan hasta la filosoffa y litcratura europeas de 
principios del siglo XX. No obstante, dos per¬ 
sonas, uno filbsofo y el otro escritor, se desta- 
can como los contribuycntcs originates al punto 
de vista fenomenolbgico modemo. El filbsofo 
alemdn, Edmund Husserl (1859-1938), inven- 
tb la complcja filosoffa de la fenomenologfa quc 
se ocupaba dc la description de los fenbmenos 
mentales puros. Su enfoque era principalmcntc 
introspcctivo y casi inescrutablc. Mas asequi- 
ble era el escritor danbs Soren Kierkegaard 
(1913-1855), muy conocido por sus contribu- 
ciones al existencialismo. fiste es el movimienlo 
literario y filosOfico que se ocupa del significa- 
do de la vida y de la libertad del individuo para 
elegir sus propias metas. La fenomenologfa dc 
Husserl y el existencialismo dc Kierkegaard 
influyeron a docenas de importantes filosofos 
y psicOlogos. Los vesligios de estos primeros 
puntos de vista son evidentes en casi cualquier 
teorfa fenomenolbgica contempordnea (Maddi, 
1989). 



TEORIAS FENOMENOLOGICAS 
DE LA PERSONALIDAD 


Las teorfas fenomenolbgicas de la personalidad 
enfatizan la importanciadc la experiencia inme- 
diata, personal y subjetiva como determinante 
de la conducta. Algunas de las posturas tebricas 
resumidas bajo cstc tftulo han rccibido tambicn 
otros nombres, como teorfas humanistas, exis- 


CARL ROGERS, LA TEORIA Da S\ MISMO 
Y LA TECNICA Q 

El tcOrico fenomenolbgico con mayor influen- 
cia fue Carl Rogers (1902-1987). Sus contri- 
buciones a la teorfa de la personalidad, conocida 
como teorfa del sf mismo, son extensas y en 
general muy bien aceptadas por los estudiantes 
depsicologfa (Rogers, 1951, 1961, 1980). Pero 
tambidn es cicrto, aunque sea poco reconoci- 
do, que Rogers ayudb a conformar una peque- 
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fia parte de las pruebas psicoldgicas al popula- 
rizar la tdcnica Q. 

La tecnica Q es un proccdimiento para estu- 
diar los cambios en autoconcepto, un clcmenlo 
clave en la teon'a del sf mismo de Rogers. Fue 
Stephenson (1953) quicn desarrollo la tdcnica, 
pero una scrie de estudios rcalizados por Rogers 
y sus colaboradorcs sirvid para popularizar este 
enfoque de mcdicidn (Rogers y Dymond, 1954). 
La tdcnica Q, tambidn conocida como Clasifi- 
cacidn Q, es un proccdimiento gcncralizado que 
es cspccialmente util para estudiar los cambios 
en el autoconcepto.* La clasificacidn Q con- 
siste de un gran numero de tarjetas, cada una 
de las cuales conliene una afirmacidn impresa 
como las siguientes: 

Soy equilibrado. 

Doy una apariencia falsa. 

Me hago fuertes demandas. 

Soy una persona sumisa. 

Soy agradable. 

Se pide a la persona examinada que clasifiquc 
aproximadamentc 100 de las afirmaciones en 
nueve pilas, colocando un numero determina- 
do de tarjetas en cada una de ellas, con lo cual 
se fuerza una distribucidn casi normal. Las ins* 
trucciones espccifican que la persona debe co- 
locar en un extremo las tarjetas que m&s la 
describen, en el extremo opucsto deben ir aque- 
Has que menos la describen y aqudllas hacia 
las cuales sc muestra indiferente o indecisa dc- 
ben colocarse a la mitad de la distribuciOn. Iista 
podrfa pareccrse mds o menos a la siguiente: 

Menos pare- Mds parc- 

cido a mi cido a mi 

Num. de pila 1234 5 6789 

Num. de tarjetas 1 4 11 21 26 21 11 4 I 

* La ttenica Q ticnc tambiln aplicacioncs adicionales. 
Marks y Sccman (1963) emplcaron clasi ficacioncs Q 
de terapeutas para describir a pacicntcs con perfilcs 
espectficos cn cl MMPI. Bern y Funder (1978) reco- 
miendan una clasificaci6n Q para obtener un perfil de 
caracterfsticas asociadas con cl dcsempefk) exitoso en 
una tarca espedfica Pucdc predecirse cl tfxito en la 
larea scleccionada de las personas cuya autodcscnp- 
ciones cncajan en el perfil oblcnido. 


La naturaleza de los reactivos sc determina por las 
necesidadcs del investigador o del profesional. 
Rogers utilizaba un conjunto de reactivos dise- 
fiados por Butler y Haigh (Rogers y Dymond, 
1954, cap. 4) para Ilegar al autoconcepto. Estas 
afirmaciones se tomaron al azar de protocolos 
terapeuticos disponibles; sus reactivos en lacla- 
sificacion Q representaban afirmaciones reales 
de clicntcs. parafrascadas con claridad. Pero una 
virtud especial de la tlcnica Q es que otros in- 
vestigadores o profesionales estiin en libertad 
de disenar sus propios reactivos. Por ejemplo, 
Marks y Seeman (1963) utilizaron una perspec- 
tiva psicodindmica para disenar reactivos para 
las descripciones del terapeuta acerca dc gru- 
pos dc pacientes. Ejcmplos dc dstos incluyen: 

Utiliza acting out como mecanismo de dc- 
fensa. 

Ticnde a ser indiferente tanto dc palabra 
como dc obra. 

Genotipo ticnc caracterfsticas paranoides. 

Parece equilibrado, seguro dc sf mismo, 
socialmente relajado. 

Exhibe depresidn (tristeza manificsta). 

En general, la calificacidn que se asigna a una 
clasificacidn Q es cuestidn de comparai - o co- 
rrelacionar la distribucion de reactivos contra 
una norma establecida. Por ejemplo, podrfa pe- 
dirse a personas bien adaptadas que clasifica- 
ran los reactivas de modo que se obtuviera un 
numero promedio de colocacidn por pila (de 1 
al 9) para cada reactivo. A un indi viduo exami- 
nado se le considerarfa mds o menos adaptado 
segun el parecido entre sus clasificaciones y la 
clasificacidn promedio de personas adaptadas. 
El lector puedc consul tar a Block (1961) para 
los detalles. 

Otra manera dc utilizar la clasificaci6n Q 
consiste en comparar la autoclasificacidn dc la 
persona evaluada con su clasificacidn ideal. 
Rogers utilizaba la discrepancia entre ambas 
clasificaciones como fndice dc adaptation. Pe- 
dfa a sus personas que clasificaran los reactivos 
en dos ocasiones, de acuerdo con las siguien¬ 
tes instrucciones: 

1. Autoclaslficacion. Clasifiquc estas tarjetas 
para dcscribirse a usted mismo como se ve 
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hoy dia, desde aquellas quc rcprcsentan mc- 
nos lo que es usted hasta aquellas quc se 
parcccn mis a usted. 

2. Clasificacion ideal. Ahora clasifique estas 
tarjetas para describir a su persona ideal —la 
persona que usted, en su interior, mis qui- 
siera ser (Rogers y Dymond, 1954). 

Al utilizar los numcros de pila de las rcactivos, 
Rogers correlacionaba por separado las dos cla- 
sificaciones de cada individuo. Considerese lo 
que significan cstos datos: si la autoclasificacidn 
y la clasificacidn ideal son sumamente similarcs, 
la correlacidn de los datos de la clasificacidn Q 
se nccrcaran a 1.0; si ambas clasificaciones son 
opuestas. la eorrelacidn se acercard a -1.0. Por 
supuesto, la mayor parte de las clasificaciones 
se colocardn cn algun sitio intermedio, pero 
por lo comtin hacia el lado positivo. Butler y 
Haigh encontraron que los clientes cn psicote- 
rapia aumentaban su congrucncia entre su 
propia imagen y su ideal (Rogers y Dymond, 
1954, cap. 4). Aun as(, los participantes con¬ 
trol adaptados posefan mayor congruencia 
(cuadro 13-2). 


TEORIAS CONDUCTUALES 
Y DEL APRENDIZAJE SOCIAL 


Las teonas conductuales y del aprendizaje social 
ticncn sus orfgenes en estudios de laboratorio 
sobre cl aprendizaje operante y el condiciona- 
mientocllsico. Una suposicidn fundamental de 
lodos los tedricos conductuales es que muchas 
de las conductas que conforman la personali¬ 
dad son aprendidas. Entonces, para comprcndcr 


la personalidad, se debe conoccr la historia de 
aprendizaje del individuo. Los tedricos conduc- 
tualcs tambidn consideran que el ambientc tie- 
ne una importancia suprema en cl moldcamiento 
y mantenimiento de la conducta. Por tanto, la 
investigacidn conductual busca identificar 
los componcntcs dentro del ambientc actual quc 
controlan la conducta de una persona. El enfo- 
que conductual de la personalidad ha produci- 
do una variedad de metodos de evaluacidn 
directa que sc anaiizan cn el siguiente capftulo. 

El desacuerdo principal de los tedricos con¬ 
ductuales se refiere al papcl que rcprcsentan las 
cogniciones como determinantes de la conduc¬ 
ta. feilas son procesos mcntales inferidos como 
la solucidn de problcmas, cl juicio o el razona- 
miento. Los conductistas radicalcs consideran 
quc es inutil recurrira explicaciones mcntalistas 
de algun tipo: “Cuando aqucllo que hace una 
persona se atribuyc a lo quc ocurrc cn su inte¬ 
rior, la investigacidn llega a su fin" (Skinner, 
1974). En contraste, los tedricos del aprendizaje 
social haccn una referenda cauta a las cognicio¬ 
nes en la cxplicacidn de qud es, en tdrminos 
especfficos, lo que una persona aprcnde. Un 
tedricodel aprendizaje social podnadiscutirquc 
aprendemos expectativas o reglas acerca del 
ambientc, no sdlo conexiones entre estfmulo y 
respuesta. 

En la actualidad, la teorfa del aprendizaje 
social puede considerarse como una variante 
cognitiva del conductismo cstricto que domi- 
naba a la psicologfa estadouniden.se a princi- 
pios del siglo XX. Los tedricos del aprendizaje 
social accptan la premisa skinneriana de que el 
reforzamiento extemo es un determinante im- 
portante de la conducta. Pero a la vcz sostienen 
que las cogniciones tambidn tienen una influen- 


Cuadro 13-2. Correlaclones promedio del si mismo ideal para los grupos 

de clientes y control 



Preorientacidn 

Posorlentacidn 

Seguimiento 

Qrupo de clientes (N = 25) 

-.01 

.36 

.32 

Grupo control (A/ =16) 

.58 


.59 


Fuenlo: Basado on Rogers, C. R y Dymond, R. F (eds )(1954) Psychotherapy and personality changeCo-ontinaled research studies 
the chert-centered approach Chicago: The University ot Chicago Press. 
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cia crftica sobre nuestros actos. Por ejemplo. 
Roller (1972) ha popularizado el punlo de vis- 
la de que nucslras expectalivas acerca dc los 
rcsultadas futuros son los principals dctermi- 
nantes de la conducla. Por ejemplo, la probabi- 
lidad de que una persona se comportc de mancra 
agrcsi va dcpende de sus cxpeciativas acerca de 
los rcsultados probables dc su propia agresivi- 
dad. Si la persona valora el resultado esperado, 
la conducta sc vucl ve m<1s probable. Por supues- 
lo, las expectalivas est4n en funcidn dc la his¬ 
toria de rcforzamienio de la persona, de modo 
que la perspectiva del aprendizaje social dc 
Rotter es similar al punto de vista conductual. 
Pcro la implicacidn dc la teon'a del aprendizaje 
social es que la conducta es el resultado de una 
creencia, cn particular aqudlla de que la con¬ 
ducla tendra como efecto un resultado dcsea- 
do. Asf, se supone que las cognicioncs afectan 
a las acciones. 

Con base en sus perspectivas del aprendi¬ 
zaje social, Rotter (1966) desarrolld la Escala 
internn-extema (I-E), una intcrcsante medidadel 
locus de control interno contra el extemo. El 
constructo del locus dc control se reficre a las 
percepciones que ticncn los individuos acerca 
dc la fuente de las cosas que les succden. En 
particular, la Escala I-E busca evaluar las cx- 
pcctativas generalizadas de la persona cn cuanto 
al control de reforzamiento interno contra el 
extemo. El prop6sito de la Escala I-E consiste 
cn determinar el grado en que la persona exa- 
minada crec que el reforzamiento es conlingcnte 
a su conducta (locus de control interno) mils 
que dependa del mundo exterior (locus de con¬ 
trol externo). El instrumento es un inventario 
de autoinforme de eleccidn forzada. Para cada 
reactivo, cl individuo evaluado elige la tinica 
afirmacidn (de un par) con la que mds coinci¬ 
de. £stos se parecen a los siguientes: 

En general, la mayon'a de las personas rc- 
ciben el respeto que se mereccn. 

O 

En realidad, es frecuente que la valfa dc 
una persona pase dcsapcrcibida. 

Para el reactivo anterior, la primera altcmativa 
indica un locus dc control interno, mientras que 


la segunda implica un locus de control extemo. 
El cquilibrio entre respuestas intemas y extemas 
determina la calificaci6n total en la escala. La 
escala I-E es un instrumento confiable y vdlido 
que ha cslimulado una amplia cantidad de inves- 
tigaciones acerca de la naturaleza y significado 
del locus de control y variables relacionadas. 
La investigacidn indica que el locus de control 
ticnc una fuerte relacidn con el 6xito laboral, la 
salud ffsica, logros acaddmicos y otras nume- 
rosas variables. Como podn'a sospcchar el lec¬ 
tor, un locus de control interno en general 
prcdicc un resultado mils positivo que un locus 
dc control extemo. El lector interesado puedc 
consultar a Lefcourt (1982) y Wall, Hinrichsen 
y Pollack (1989) para mayorcs dctalles. 

Albert Bandura tambidn ha realizado im- 
portantes contribuciones a la teorfa del apren¬ 
dizaje social. En sus primeros estudios. Bandura 
examind el papel del aprendizaje observacional 
y del reforzamiento vicario en el dcsarrollo dc 
la conducta (Bandura. 1965, 1971; Bandura y 
Walters, 1963). De manera mils recicnte, ha 
propuesto que la autoeficacia percibida es un 
mccanismo central cn las acciones humanas 
(Bandura, 1982; Bandura, Taylor, Ewart, Miller 
y DeBusk, 1985). La autoeficacia es un juicio 
personal acerca de “qud tan bien puedc uno llcvar 
a cabo los cursos de accidn requeridos para ma- 
nejar situaciones evcntuales” (Bandura, 1982). 
El concepto dc autoeficacia es dtil en la expli- 
cacidn de por qud el conocimicnto correcto no 
nccesariamente predice una accidn eficaz. Por 
ejemplo, dos niflos pueden estar convencidos 
por igual de que una serpiente de jardfn en la 
lina del bano no representa un peligro, pcro uno 
la recoge mientras que el otro sale corriendo. 
Estas diferencias en conducta ilustran el papel 
del pensamiento aulorrcfcrcncial como inedia- 
dor entre conocimienlo y accidn. El nino que 
sale corriendo no crefa que pudiera manejar la 
situacidn de mancra eficaz. Tenfa poca autoefi¬ 
cacia percibida en cuanto a manejo dc serpicn- 
tes. Bandura discutirfa que el dclcrminante 
principal de la conducta del nifio es su propio 
juicio acerca dc sus capacidadcs pcrsonales. Por 
tanto, se supone que las cogniciones son un 
determinante primordial de la conducta. 



Bandura ha desarrollado un intercsanle 
instrument!) para la evaluacidn de las expecta- 
tivas de autoeficacia (Bandura. Taylor, Ewart, 
Miller y BeBusk, 1985). Para una variedad de 
situaciones que podrfan excitar ansiedad, mo- 
Icstia o enojo, el individuo examinado marca si 
“pucdc hacer” la tarea y tambicn califica el gra- 
do de confianza utilizando un numero de 10 a 
100. El formato de la lista de vcrificacidn es 
corno sigue: 

10 20 30 40 50 60 70 80 90 100 

Bastantc Modcradamente Seguro 

inseguro seguro 

Puedo hacerlo Confianza 

Ir a una fiesta cn 
la que no haya 

nadie conocido. _ _ 

Quejarse de la 
mala comida en 

un restaurante. _ _ 

En esencia, el instrumento de Bandura es una 
herramienta referida a criterio que sc utiliza en 
psicotcrapia e investigacidn. 

§§ CONCEPTOS SOBRE RASGOS 
m DE PERSONALIDAD 


Un rasgo es cualquier "manera relativamente 
duradera en la que un individuo difiere de otro” 
(Guilford, 1959). Los psicdlogos desarrollaron 
cl concepto de rasgo a partir de las formas en 
que las personas describen a otras cn la vida 
cotidiana. A medida que evoluciond el lengua- 
je, las personas encontraron palabras para rc- 
presentar las consistencias y diferencias que 
enfrentaban en sus intcraccioncs diarias con 
los demas. Asf, cuando se dice que una persona 
es sociable y otra es timida, se utilizan nom- 
bres de rasgos para describir las consistencias 
dentro de los individuos y tambidn las diferen¬ 
cias entre ellos (Goldberg, 1981a; Fiske, 1986). 

Los conceptos sobre rasgos de personal i- 
dad han sido sumamente populares a lo largo 
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de la historia de las pruebas psicoldgicas, de 
modo que cn nuestro caso la cobertura seri se- 
lectiva por necesidad. Se rcvjsarin tres posturas 
importantes e influyenies entre las doccnas de 
tcorias de rasgos que se han propuesto. Estos en- 
foques difiercn principalmente en tdrminos de 
si los rasgos se dividen en variantes finamen- 
tc discriminables o sc agrupan cn un pcqucho 
numero de dimensioncs amplias: 

1. El punto de vista analftico-factorial de Cattcll 
identifica de 16 a 20 dimensioncs bipolares 
de rasgo. 

2. El enfoque dimensional de rasgos de Eysenck 
une doccnas de rasgos en dos dimensiones 
prevalecientes. 

3. Goldberg y otros han buscado una sfntcsis 
modema de todos los enfoques de rasgo al 
proponcr un modelo de los cinco factores de 
la personalidad. 

Para los lectores que deseen un anilisis mis 
detallado sobre este tema, Pervin (1993) y 
Wiggins (1997) proporcionan una excelente 
resena de los enfoques dc rasgo dentro de la 
teorfa de personalidad. 

TEORIA ANAUT1 CO-FACTORIAL 
DE RASGOS DE CATTELL 

Cattcll (1950, 1973) depurd los mdtodos de 
anilisis factorial existentes para ayudar a reve¬ 
lar los rasgos bisicos de la personalidad. De¬ 
nomind rasgos superficiales a los aspectos 
mis obvios de la personalidad. Por lo comun, 
dstos surgirfan en las primeras etapas del anili- 
sis factorial cuando se correlacionaran entre sf 
los reaclivos individuals de una prueba. Por 
ejemplo, reaclivos de cierto-falso como “Dis- 
fruto una buena pelea de campeonato”, “Real- 
mente me molesta quedar atrapado detris de 
un conductor lento” y ‘‘Es importante haccr- 
le saber a la gentc que uno tiene el mando”, po¬ 
drfan recibir respuestas similares de parte de 
los individuos, con lo cual sc revclarfa un ras¬ 
go superficial de agresividad. 

No obstante los rasgos superficiales en sf 
tendfan a agruparse, como lo rcvelaron las apli- 
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cacioncs mis complcjas del an&lisis factorial 
que rcalizo Cattell. Para dl, dsta era evidencia 
dc la existencia dc rasgos fuente, los orfgenes 
cstablcs y constantes de la conducta. Por tan- 
(o, los rasgos fuente son menos visibles que 
los superficiales. pero son mis importances cn 
la cxplicacidn dc la conducta. 

Cattell (1950) no tuvo rival en la utiliza- 
cidn del anfilisis factorial para descubrir la ma- 
nera en que se organizaban los rasgos y edmo 
se relacionaban entre sf. Un enfoque consistfa 
en hacer que las personas calificaran a olios 
individuos a quienes conocfan, al marcardi ver¬ 
sos adjetivos como agresivo, considerado y 
dominnntc en una lista dc 171 opcioncs. Cuan- 
do posteriormente sc analizaron factorialmente 
los rcsultados de 208 personas, se identifica- 
ron de modo tentativo cerca dc 20 factores o 
rasgos subyaccntes de personalidad. Otro en¬ 
foque consistid cn hacer que miles de personas 
respondicran preguntas acerca de sf mismas y 
despuds rcalizar un andlisis factorial dc sus res- 
pucstas. A travds de cste segundo enfoque, sc 
confirmaron dc mancra independiente 16 dc los 
20 rasgos originales dc personalidad (Cattell, 
1973). Estos 16 rasgos fuente se han incor- 
porado al Cuestionario dc 16 factores de 
personalidad, una prueba de lApiz y papel para 
los rasgos de personalidad que sc analiza cn cl 
siguientc capftulo. 

TEORIA DIMENSIONAL DE RASGOS 
DE EYSENCK 

Eysenck utilizd cl anllisis factorial para pro¬ 
duct un acercamiento econdmico entre los en- 
foques de rasgo y dimensidn de la personalidad 
(Eysenck y Eysenck. 1975, 1985). Scgun su 
sistema, la personalidad consiste de dos dimen- 
siones basicas. introvertida-extravertida y emo- 
cionalmentc estable-emocionalmente i nestable. 
Se suponc que cstas dos dimensiones ticncn una 
base bioldgica y gendtica. Ademls, las dimen¬ 
siones incluyen numerosos rasgos especfficos 
(figura 13-1). Las posicioncs dc los 32 ras¬ 
gos corresponden a la dircccidn y cantidad dc 
las dos dimensiones blsicas. Por ejemplo, una 
persona moderadamente extravertida que sea 


inestable a nivel moderado podrfa caracterizar- 
sc por los siguientes rasgos: agresiva, excita¬ 
ble, cambiante. Una persona muy introvertida 
que se encuentre a la mi tad en la dimensidn esta- 
blc-incstablc podria considerarse como poco so¬ 
ciable, tranquila, pasiva y cuidadosa. La tcorfa 
dimensional de rasgos de personalidad dc 
Eysenck se incorpora en su inventario de per- 
sonalidad, el Cuestionario de personalidad de 
Eysenck, que se rcvisarf cn el siguientc capftulo. 

MODELO DE LOS C1NCO FACTORES 
DE LA PERSONALIDAD 

El modclo de los cinco factores dc la persona¬ 
lidad ticnc sus orfgenes en una revisidn reali- 
zada por Goldberg (1981b). En su anAlisis de 
la investigacidn analftico-factorial de los ras¬ 
gos, Goldberg identified varias consistencias a 
las que denomind las “Cinco grandcs" dimen¬ 
siones. Aunque los investigadores han utiliza- 
do tdrminos un tamo diferentes para estos 
factores, los nombres mds cornunes son: 

Neuroticismo. 

Extraversidn. 

Apertura a la expericncia. 

Conformidad. 

Escrupulosidad. 

Un reacomodo de los factores produce las sen- 
cillas siglas: NACEE. El modclo de los cinco 
factores se ha vuelto rdpidamente el modclo 
consensual de la personalidad. La sustentacidn 
para el enfoque de los cinco factores provicnc 
dc varias fuentes que incluyen el andlisis 
factorial de los tdrminos para rasgos dentro del 
lenguaje y cl an&lisis dc la personalidad a par- 
tir de una pcrspcctiva evolutiva. A continua- 
cidn se analizan estos puntos dc vista. 

El uso de los tdrminos de rasgo en el andli- 
sis de la personalidad se basa en la hipotesis 
lexica fundamental. El punto esencial de esta 
hipdtesis es que los tdrminos para rasgos han 
sobrevivido cn cl lenguaje debido a que tras- 
miten informacidn importante acerca de nues- 
tro trato con otras personas: 

La variodad de diferencias tndtviduales es cast 
ilimitada; sin embargo, la mayor parte de estas 
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EMOCIONALMENTE 
INESTABLE (NEUR6TICO) 


/ Taalumo 
/ Ansioso 
/ Rlgkto 
Mesurado 
Pesimista 
Reservado / 
Poco sociable / 
TranquUo / 


Sensible \ 
inlranqulto ' 
Agroslvo 
Excitable 
Cambranle 
\ Impulsivo 
\ Optimista 
\ Actlvo 


Metancblico 


INTROVERTIDO 


EXTRAVERTIDO 


Sanguined 


Flemailco 


Pa&'wo \ 

Cuictadoso \ 
Conslderado \ 
Pacltico 

\ Controtado 
\ Conltable 
\ Ecudnime 
\ Calmado 


/ Sociable 
/ Abierto 
/ Comunicallvo 
Receptivo 
Oesproocupado 
Vivaz y 

Alegre / 

Uderazgo / 


Flgura 13-1. Clastlicacidn btdimenslonal do los rasgos de personalidad de Eysenck. 

Fuento: Reproducido con autorizacidn de Eysenck. H. J. y Eysenck, M.W. (1985). Personality and Individual 
(Utterances: A natural science approach. New York: Plenum. 


dllerenclas son inslgnlficantes en las interaccio- 
nes cotidianas de las personas con otros indivi- 
duos y casl nunca se les reconoce. Sir Francis 
Gallon puede haber eslado entre los primeros 
cientlficos en reconocor de manera explfcita 
la hipdtosis lexica fundamental —es deck, que la 
mayor parte de las dlferencias individuales im- 
portantes en las transacclones humanas se co- 
dillcardn con Idrminos sencillos en algunos o en 
todos los idlomas del mundo (Goldberg, 1990). 

Cuando en el caso del idioma inglds los tdrminos 
de rasgo se reducen a un conjunlo razonable- 
mente concreto y no superpuesto de adjetivos, 
por lo comun surgen unos cuantos cientos de 
caracterfsticas (Allport, 1937). Durante dece- 
nios, los investigadorcs le han pedido a los in- 
di viduos que se califiquen a sf mismos o a otras 
personas en dstos u otros rasgos similares. 
Cuando estas califtcaciones se somctcn a un 
andlisis factorial, por lo general aparecen de una 


manera u otra las cinco grandcs dimcnsiones 
que sc seiialan antes. En rcsumen, un conjunto 
cada vcz mayor de invcstigaciones indica que 
el modelo de los cinco factorcs capta una re- 
prcsenlaeidn vdlida y util de la estructura de los 
rasgos humanos. 

El cnfoque de los cinco factores tambidn 
posee credibilidad evolutiva. En espccffico, los 
cinco factores de personalidad que se mencio- 
naron antes captan difercncias individuales que 
se relacionan con funciones evolutivas bdsicas 
como la supervivcncia y el dxito reproductive 
(Buss, 1997; Pervin, 1993). Goldberg (1981b) 
ha teorizado que las personas haccn de manera 
impKcila las siguientes preguntas en sus intcr- 
accioncs con otros: 

1. i,X es activo y dominante o pasivo y sumiso? 
(^Puedo intimidar a X o X tratard de intimi- 
darme?) 











590 • Evaluation pslcologlca: Hlstorla, prlnclplos y aplicaciones 


(Capflulo 13) 


2. i,X cs afable (cdlido y agradable) o desagra- 
dable (frfo y distante)? 

3. /.Puedo contar con X? (^X es rcsponsable y 
escrupuloso o poco confiable y negligcnte?) 

4. i,X cstd loco (imprevisible) o cuerdo (esta- 
ble)? 

5. i,X es listo o tonto? (^Qud tan fdcil me serd 
ensefiar a X?) 

De manera directa o indirecta, cada una dc eslas 
valoracioncs se relaciona con la supervivencia 
o cl dxito reproductivo. Por ejemplo. el punto 3 
(escrupulosidad) implica un rasgo que podrfa 
asegurar la supervivencia del grupo en un mun- 
do hostil. Una persona baja en cste rasgo (poco 
confiable) seria una elecci6n pobre para protc- 
ger el abastecimiento de comida. La capacidad 
para disccmir la escrupulosidad en otros tiene, 
por tanto, un valor adaplati vo. No es de sorpren- 
der que los cinco puntos mencionados antes 
correspondan al modelo de los cinco factores 
de la personalidad. 

Costa y McCrae han desarrollado dos prue- 
bas de personalidad con base en el modelo de 
los cinco factores (Costa, 1991; McCrae y Cos¬ 
ta, 1987). El Inventario NEOdc pcrsonalidad- 
Rcvisado (NEO-PI-R) contienc 240 reactivos 
caliOcados en una escala de cinco puntos. Ade- 
mds de los cinco principales dominios dc la 
personalidad, el inventario mide seis rasgos es- 
pecfficos (llamados facetas) dentro de cada uno. 
Tambidn estd disponible una versidn abreviada 
con 60 reactivos que sc conocc como Inventa¬ 
rio NEO dc cinco factores (NEO-FFI). Trull, 
Widiger, Useda y colaboradores (1998) han pu- 
blicado una entrevista semiestructurada para 
la evaluacidn del modelo de los cinco factores 
dc la personalidad. Estas pruebas se analizan 
en el siguiente capftulo. 


COMENTARIO SOBRE EL CONCEPTO 
DE RASGO 

El reto que enfrentan los tedricos dc los rasgos 
es que durante largo tiempo los psicdlogos han 
sabido que en cualquier diccionario estandar del 
inglds pueden cncontrarsc miles dc nombres de 


rasgos. Por ejemplo, en uno de los primeros y 
mds influyentes estudios, Allport y Odbert 
(1936) registraron mds de 18 000 nombres de 
rasgos. Obviamente, dstos son demasiados 
como para ser utiles en cualquier teorfa dc per¬ 
sonalidad o en una prueba, de modo que es ne- 
cesario que los te6ricos busquen un numero mds 
pequcfio y mancjable de rasgos bdsicos. Hasta 
hace poco, no existfa un consenso en cuanto al 
numero de rasgos fundamentals. Algunos ted- 
ricos propusieron dos o ires factores de rasgo 
prcvalecicntes, mientras que otros dividieron el 
dominio dc la personalidad en 16 a 20 dimen- 
siones de rasgo. Muchos tedricos de la perso- 
nalidad —quizd la mayorfa— admiten hoy en 
dfa que los cinco factores seiialados antes 
(Ncuroticismo, Exlraversidn, Apcrtura, Confor- 
midad y Escrupulosidad) proporcionan una 
manera econdmica y util de ver la personali¬ 
dad. Pero este modelo es muy reciente y reque- 
rird tiempo confirmar su utilidad. Por ejemplo, 
todavfa hay un debate en cuanto a si apcrtura a 
la experiencia pertenece a la lista de dimensioncs 
fundamentales de la personalidad (Digman, 
1990). Tambidn, ^por qud no se incluye al 
intclecto dentro del modelo de cinco factores? 

Todos los enfoques de rasgos de personalidad 
comparten ciertos problemas. Primcro, existe 
desacucrdo en cuanto a si dstos causan la 
conducta o sdlo la dcscribcn (Fiske, 1986). 
Puede disculirse dc manera persuasiva que 
invocar los rasgos como causas es una forma 
vaefa de razonamiento circular. Por ejemplo, po- 
drfa dccirse que una persona con normas muy 
elevadas posee cl rasgo de perfcccionismo. Pcro 
cuando se pide cxplicar qud sc quicre decir con 
perfeccionismo, invariablcmcntc uno termina 
haciendo referenda a un patr6n dc normas muy 
elevadas. Asf, cuando se afirma que alguien es 
perfeccionista, /.en realidad se estd haciendo algo 
mds que proporcionar una descripcidn abre¬ 
viada de su conducta pasada? Miller (1991) ha 
dado voz a esta crftica del enfoque de cinco 
factores, senalando que el modelo s61o descri¬ 
be la psicopatologia, pcro no la explica. 

Un segundo problema con los rasgos es su 
validez predictiva aparentemente baja. Se re- 
conoce a Mischel (1968) por haber sido el pri- 
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mcro cn desacreditar de manera cficaz el con¬ 
cept de rasgo cn su influycnte libro Personality 
and Assessment. Este autor afirmd que "mienlras 
la teorfa de los rasgos predice la consistencia 
conductual, lo que se observe por lo comun es la 
inconsistency en la conducts" (Mischel, 1968). 
En una ampiia resena de la investigacidn exis- 
tentc. Mischel scnald que las escalas de rasgo 
producfan coeficientes de validez con un Ifmitc 
superior de r = .30. Dicho autor acund el tdrmino 
cocficiente de personalidad para dcscribir es- 
tas correlaciones bajas. Aunque sin duda son sig- 
nilicalivas para grandcs mucstras de individuos, 
las correlaciones de r = .30 son de valor mfnimo 
en la prediccidn de la conducts individual. 

Los investigadorcs de los rasgos respon- 
dicron a los ataques de Mischel refinando y li- 


mitando el concepto de rasgo. £stos buscaron 
idcntificar subgrupos de personas cuyas con¬ 
duces pudicran predecirsc dc manera precisa 
con base cn las calificacioncs de rasgo y tam- 
bidn intentaron distinguir los tipos de situacio- 
nes en las que dstos determinan en gran medida 
la conducta (Amclang y Borkenau, 1986; Bern 
y Allen, 1974; Houts, Cook y Shadish, 1986; 
Moskowitz, 1982; Wright y Mischel. 1987). 
Estos esfuerzos Iograron un dxito modesto, elc- 
vando la validez de algunos cuestionarios de 
rasgo—cn algunos contextos y con ciertas per¬ 
sonas— sustancialmente mds alld de la omino- 
sa barrera del .30 plantcada por Mischel (1968). 
Pcro han quedado lejos los dfas de las asevera- 
ciones simplistas y generalizadas como la de 
que "el rasgo X predice la conduce Y”. 


Presumen 

1. La personalidad es un constructo vago que 
se invoca para explicar la consistencia 
conductual dentro de las personas y la 
distintividad conductual entre dstas. A fin 
de apreciar la naturaleza de las pruebas de 
personalidad. es util revisar las teorfas so- 
bre cl tema. 

2. Las teorfas psicoanalfticas dc personalidad 
se iniciaron con el trabajo original de 
Sigmund Freud. Segun la teorfa tripartita 
dc Freud acerca de la mente, la conduce es 
cl resuledo dinamico de la lucha entre el 
ello, yo y superyd. El ello es complctamen- 
te inconsciente, se orienta al placer y es el 
asiento dc todas las necesidadcs instinti vas, 
como aqudllas de comida, agua, gratifica- 
cidn sexual y evitacidn del dolor. 

3. Poco despuds del nacimiento, parte del ello 
cvoluciona para formar el yo o sf mismo 
consciente. El yo sirve al ello, pero obede- 
ce al principio de realidad. El yo tambidn 
debe enfrentarsc al superyd, el componen- 
te dtico de la personalidad que se modela 
con base en las normas paternas y sociales 
de lo que es correcto e incorrecto. 


4. Para ayudarse en csta tarea diffcil, el yo 
emplea mccanismos de defensa, que con- 
sisten de una variedad de estrategias 
cognitivas inconscientes para protegerse 
de la ansiedad. Los mccanismos de defen¬ 
sa como la proyeccidn (atribuir las propias 
faltas a los demds) funcionan porque 
distorsionan la realidad. 

5. En un estudio longitudinal con entrevistas, 
Vaillant ha mostrado que los mecanismos 
de defensa tienden hacia mayor madurez 
en la mitad de la vida. Tambidn, cl uso de 
mecanismos de defensa maduros en la 
adultez joven predicen un mejor resultado 
en la vida adulta, como se mide a travds de 
critcrios independientes como la estabilidad 
matrimonial, ausencia dc problemas con 
drogas y similares. 

6. Las teorfas de tipo intentan clasificar a los 
individuos cn categorfas o tipos separados. 
Por ejcmplo, cl patrdn conductual Tipo A, 
con propensi6n a la cardiopatfa, incluye 
inseguridad dc estatus, hiperagresividad, 
hoslilidad fibre flotantc y una sensacidn de 
urgencia dc tiempo (enfermedad de la pri- 
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sa). Las personas Tipo A —en particular 
aqudllas con propensidn al enojo o a la ur- 
gcncia de ticmpo— pueden cstar en mayor 
riesgo de sufrir cardiopatfas e infartos. 

7. Las teorfas fcnomcnoldgicas de la pcrsona- 
lidad enfatizan la importancia de la expe- 
riencia inmcdiata, personal y subjcti va como 
dctcrminantc de la conducta. La perspccti- 
va fenomenoldgica se origind con el fil<S- 
sofo aleman Husserl y con el escritor 
existcncialista dands Kierkegaard. 

8. El teorico fenomenoldgico con mayor in- 
flucnciu fuc Carl Rogers, quien crcfa que el sf 
mismo y cl autoconccpto son centrales para 
la personalidad. Rogers inventd la clasifica- 
cidn Q para medir el autoconcepto y el sf mis¬ 
mo ideal. En dsta, el individuo examinado 
clasifica afirmacioncs autorrcfcrcncialcs cn 
aproximadamente nueve pilas (“mcnos pa- 
recido a mf’ hasta “m«Ss parecido a mf’). 

9. Una suposicidn fundamental de todas las 
teorfas conductuales y del aprendizaje so¬ 
cial cs que muchas de las conductas que for- 
man la personalidad son aprendidas. Los 
tedricos conductuales radicales, como 
Skinner, no considcran que las cogniciones 
tengan algun papel cn la cxplicacidn de la 
conducta. En contraste, los tedricos del 
aprendizaje social, como Rotter, crecn que 
las expectativas (cogniciones) accrca dc los 


reforzadores ambicntalcs son los principa- 
les determinantes de la conducta. 

10. Guilford define a un rasgo como cualquier 
manera relativamente duradera en la que 
un individuo difierc de otro. Las teorfas de 
rasgo surgieron a partir dc los modos en que 
las personas describen a otras en la vida 
cotidiana. Mischel ha senalado que una 
de las principalcs dcbilidadcs del enfoque de 
rasgos es que dstos poscen poca validez pre- 
dictiva, la cual en pocas ocasiones supera a 
r = .30. 

11. La teorfa analftico-factorial de Cattcll accrca 
de los rasgos denomina rasgos supcrficia- 
les a los aspectos mils obvios de la perso- 
nalidad; como la agresividad. £stos surgen 
en las primeras ctapas del andlisis factorial. 
Los rasgos fuentc —mtfs importantes y 
predictivos de la conducta que los supcrfi- 
ciales— se revelan a travds del agrupamien- 
to de los rasgos supcrficiales. El 16FP de 
Cattcll se basa en este modelo. 

12. El modelo de los cinco factores propone 
una sfntesis modema dc los enfoques dc ras¬ 
go en tdrminos de cinco dimensiones de 
personalidad: Neuroticismo, Exlraversidn, 
Apertura, Conformidad y Escrupulosidad. 
Costa y McCrae han desarrollado dos 
invenlarios basados cn este enfoque (NEO- 
PI-R y NEO-FFI). 



TERMINOS Y CONCEPTOS CLAVE 


Personalidad 

p. 576 

Elio 

p. 578 

Principiodcl placer 

p. 578 

Yo 

p. 578 

Principio dc realidad 

p. 578 

Supcryd 

p. 578 

Mecanismos dc defensa 

p. 578 

Patrdn conductual Tipo A, con 
propensidn a la cardiopatfa 

p. 582 


Tdcnica Q 

p. 584 

Locus de control 

p. 586 

Autoeficacia 

p. 586 

Rasgo 

p. 587 

Rasgos superficialcs 

p. 587 

Rasgos fuente 

p. 588 

Hipotesis lexica fundamental 

p. 588 

Coeficicntcdc personalidad 

p. 591 




Tema 13B 

Tecnicas proyectivas 


Hipbtesis proyectiva 
Compendio de tbcnicas proyeclh/as 
Tbcnicas de asociacibn 
Tbcnicas de complelamiento 
Tbcnicas de construccibn 
Tbcnicas expfesivas 
Reiteracibo: La paradoja proyectiva 

Ejemplo de caso 13-1. Pruebas proyectivas como auxiliares de la 
entrevista 

Resumen 

Tbrminos y conceptos clave 


s * sl n 




-- ; - 



^*rank (1939, 1948) introdujo el tbrmino 
mctodo proycctivo para describir una catego- 
n'a de pruebas para cl estudio de la personali- 
dad con estfmulos dcsestructurados. En una 
Prueba proyectiva, la persona examinada se 
enfrenia con estfmulos vagos. ambiguo y res- 
pondc con su propias construcciones. Los se- 
guidores de las pruebas proyectivas tienen una 
fuerte influencia de la teorfa psicoanalftica y 
de su postulado acerca de los aspectos incons- 
cientes de la pcrsonalidad. Estos examinadores 


consideran que los estfmulos dcsestructurados, 
vagos y ambiguos proporcionan la circunstan- 
cia ideal para que se revclen los aspectos inter- 
nos de la personalidad. La suposicibn central 
de las pruebas proyectivas es que las respues- 
tas de una prueba representan proycccioncs de 
los procesos mentales inconscientes mbs inter- 
nos de la persona examinada. Se presenta este 
tema con algunos conceptos y distinciones 
prcliminares que conciernen a las pruebas pro¬ 
yectivas. 
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8$ HIP6TESIS proyectiva _ 

La suposicidn dc que las intcrprctaciones per¬ 
sonates acerca de los cstfmulos ambiguos deben 
reflcjar por obligaci6n las necesidadcs, moli- 
vos y conflictos inconscicntcs del individuo 
examinado se conoce como hipotesLs proyec¬ 
tiva. En general. Frank (1939) recibe el erddito 
de haber popularizado la hipdtesis proyectiva: 

Cuando so exploran los ptocedimientos oxislen- 
tes que pueden llamarse rndlodos pcoyectivos, 
so encuefitra una amplla variedad do tdcnicas y 
materiales que se emplean para el mtsmo pro- 
pdsito general, obtener del individuo “aquollo que 
no puede o no quiere dear*, con frecuencia por- 
quo no lo sabe y no estd conscionle do lo que re¬ 
vela sobre si mismo a travds do sus proyecciones. 

El reto de las pruebas proyectivas consiste en 
dcscifrar los procesos de personalidad subya- 
centcs (necesidadcs, motivos y conflictos) con 
base en las respuestas individualizadas, unicas 
y subjetivas de cada persona examinada. En las 
secciones se analizard que tan bicn satisfacen 
las pruebas proyectivas esta tarea portentosa. 

I COMPENOK) DE TECNICAS 
PROYECTIVAS 


ORIGENES DE LAS TECNICAS 
PROYECTIVAS 

Las tdcnicas proyectivas datan del siglo pasa- 
do. Con el propdsito de una revisidn rdpida, se 
debe decirque Galton (1879) desarrolld la pri- 
mcra tdcnica proyectiva, una prueba de asocia- 
cidn de palabras. Kent y Rosanoff (1910) 
adaptaron este procedimiento a las pruebas y 
C. G. Jung y otros las utilizaron en terapia. 
Micntras tanto, Ebbinghaus (1897) utilizd una 
prueba de oraciones incompletas como medi- 
da dc la inlcligencia, pero pronto otros investiga- 
dores se dieron cuenta de que el mdtodo se 
adaptaba mejor a la evaluacidn dc la personali¬ 
dad (Payne. 1928; Tcndler, 1930). Con una fucr- 


te influcncia dc las formulacioncs psicoanalfticas 
accrca de la personalidad, Rorschach public^ 
su famosa prueba de manchas de tinta en 1921. 
En 1905, Binet invenld un precursor dc las Idc- 
nicas dc narracidn de historias o de apcrcepcidn 
temdtica cuando ulilizd respuestas verbales 
hacia ilustraciones como medida de la inteli- 
gencia. £stos y otros intentos forman la piedra 
angular dc las pruebas proyectivas actuates. 

LA POPULARIDAD DE LAS PRUEBAS 
PROYECTIVAS: UNA PARADOJA 

El extenso uso dc las pruebas proyectivas ha 
continuado sin disminuir desde principios del 
siglo XX hasta nueslros dfas (Louttit y Browne, 
1947; Lubin, Wallis y Paine, 1971: Watkins, 
Campbell y McGregor 1988). De manera recien- 
te. Watkins, Campbell, Nieberding y Hallmark 
(1995) sometieron a una encucsta a mis de 400 
psicdlogos que practicaban la cvaluacidn para 
estimar la frecuencia dc utilizacidn dc diver- 
sas pruebas destacadas. Descubrieron que 5 de 
las 15 pruebas de uso mds frccuenle eran tdc- 
nicas proyectivas (cuadro 13-3). 

Paraddjicamcnte, desde el punto dc vista 
de los criterios psicometricos tradicionales, las 
pruebas proyectivas no resultan tan bien libradas 
como las objetivas que se analizan en el siguicn- 
te capftulo. El enigma esencial de las pruebas 
proyectivas es c6mo explicar la duradera po- 
pularidad de cstos instrumentos a pesar dc su 
calidad psicomdtrica algunas veces cuestiona- 
ble. Despuds de todo, no todos los psicdlogos 
son insensatos, como lampoco ignorantes dc los 
problcmas sobre calidad de una prueba. Enton- 
ces, iporqud persisten las tdcnicas proyectivas? 
Se regresard a este enigma —que podrfa 11a- 
marse la paradoja proyectiva— despuds dc que 
se familiarice al lector con los principales cn- 
foques dentro dc las pruebas proyectivas. 

UNA CLASIFICACI6N DE LAS TECNICAS 
PROYECTIVAS 

Lindzcy (1959) ha ofrecido una clasificacidn 
de las tdcnicas proyectivas que se seguird aquf. 
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Figure 13-3. Las 15 pruebas 
de utilizacidn mas frecuente en EUA 


Prueba 

Rango 

Escala Wechsler de Intellgencia 
para Adultos—Revisada 

1 

Inventario Mullifasico de la 
Personalidad—2 

2 

Metodos de frases incompletas." 

3 

Test de Apercepcidn Tematica.* 

4 

Rorschach 

5 

Tesl Guestaitico Visomotor 

6 

Dibujos proyectivos.* 

7 

Beck Depression Inventory 
(Invenlario de Depresidn Beck) 

8 

Escala Wechsler de Inteligencia 
para Ninos—III 

9 

Wide Range Achievement 

Test—Revised (Prueba de 
Rendimiento de Amplio Rango 
—Revisada) 

10 

Wechsler Memory Scale—Revised 

11 

Peabody Picture Vocabulary 

Test—Revised 

12 

Milton Clinical Multiaxial Inventory 
—//(Inventario Clfnico Multiaxial 
de Millon—II) 

13 

Escala para los Nivoles Preescolar 
y Primario—R 

14 

Tesl de Apercepcidn Infantil.* 

15 


* Denota una pfusba proyectrva Algunos examlnadoros ulilizan 
el Tesl Guestillico Visomotor como prueba proyectrva 


Fuonte: Adaptado con autorizaddn de Watkins. C„ Campbell, 
V.. Nieberdlng. R. y Hallmark, R (1995). Conlemporary practice 
ot psychological assessment by clinical psychologists Profe¬ 
ssional Psycttology, Research and Practice. 26, 54-60 


Con base en las respuestas requcridas, dividio 
las pruebas proyeclivas en cinco categories: 

• Asociacion con manchas de tinta o palabras. 

• Construccion de historias o sccucncias. 

• Coniplctamiento de frases o historias. 

• Ordcnact6n/selecci6n de iluslraciones u opcio- 
ncs vcrbales. 

• Expresidn con dibujos o juegos. 


Las tdcnicas de asociacidn incluycn la amplia- 
-’ente utilizada prueba de interpretacidn de 
Formas de Rorschach y su prima, la Holtzman 
Inkblot Test (Prueba Holtzman de manchas de 
tinta), la cual sc considcra psicometricamcntc 
superior, al igual que las pruebas de asociacidn 
de palabras. Las tdcnicas de construccidn in- 
cluyen el Test de apercepcidn tematica y mu- 
chas variaciones de este primer instrumento. Las 
(dcnicas de completamiento consisten principal- 
mentc de las pruebas de Frases incomplctas, que 
se analizan adelante. Los procedimicntos de 
ordenaci6n/selecci6n como la prueba Szondi (la 
cual se analiza en el primer cap(tulo) se utili- 
zan rare vez en la aclualidad. Por ultimo, las 
t&nicas expresivas, como cl Dibujo dc la figu¬ 
re humana o la Tdcnica del dibujo proycctivo 
de Casa-drbol-persona son muy populates en- 
tre los clfnicos, a pesar de sus dudosos datos de 
validez. 

Se revisar&n las tdcnicas m<ts notables den- 
tro de cada categorfa, cxccpto los anlicuados 
enfoques de ordenacidn/seleccidn que casi nun- 
ca se emplcan. No obstante, la literature sobre 
las principales tdcnicas proyeclivas cs simple- 
mente abrumadora, con dectnas de miles de 
art feu los nada mas acerca del Rorschach. Se 
pueden sugerir las principales tendencias en 
cuanto a investigacidn, pero serS nccesario que 
el lector consultc otras fuentes para obtener una 
resena amplia. 

M TECNICAS DE ASOCIACI6N 


RORSCHACH 

El Rorschach consiste en 10 manchas de tinta 
disehadas por Herman Rorschach (1884-1922) 
a inicios del siglo XX; formd las manchas al 
derramar tinta en una hoja de papel y doblarla 
por la mitad, produciendo disehos bilateralcs 
relativamente sim£tricos. Cinco de las manchas 
son negras o con sombreado gris, mientras cin¬ 
co contiencn color; cada una se presenta sobre 
un fondo bianco. En la figure 13-2 se muestra 
una mancha dc tinta del tipo de las cmplcadas 
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Flgura 13-2. Una mancha da tinta similar a las ancon- 
tradas an el Rorschach. 

por Ronichach. Esta prueba es adecuada para per¬ 
sonas de cinco afios de edad en adelante, pero 
por lo comun se emplca con adultos. 

Para la aplicacidn del Rorschach, el exa- 
minador se sienta al lado de la persona para re- 
ducir al minimo la comunicacidn a traves del 
lenguaje corporal. La aplicacidn consiste de dos 
fases. En la fase de asociacidn libre, el exami- 
nador presenta la mancha de tinta y pregunta 
‘‘^Qud podn'a ser esto?” Si la persona exami- 
nada pide aclaracidn (p. cj., “^Debo utilizar la 
mancha completa o sdlo parte de ella?"), el 
examinador siempre responde de modo no di¬ 
rective (‘‘Como prefiera”). La prueba precede 
de m.incra pausada, de modo que existe una 
cxpcctati va implfcita de que la persona darri mds 
de una respuesta por Idmina. No obstante, no 
se requiere esto; incluso es permisible que el 
individuo rechace la Idmina por completo, aun- 
que esto sucede rara vez. Las 10 Idminas se pre- 
sentan de modo similar. 

A continuacidn el examinador comienza 
con la fase de encuesta. En dsta el examinador 
hace preguntas para aclarar la localizacidn exac- 
ta en la mancha de cada elemento percibido y 


para determinar cuales aspectos de la misma 
como forma o color, representaron un pape| 
en la creacidn de la respuesta. Con base en la 
informacidn recabada durante la fase de encucs- 
ta, el examinador puede codificar la localiza- 
cidn. determinantes, calidad de la forma y 
contenido de cada respuesta de acucrdo con uno 
o mils sistemas formales de calificacidn. Por 
cjcmplo, si la persona evaluada utilizd la man¬ 
cha completa para su percepto, la respuesta sc 
codifica como W (completa); si la forma de la 
mancha fue importante, la respuesta tambidn 
se codifica como F (forma); si en el percepto 
aparece movimiento humano, la respuesta se 
codifica como M (movimiento); el uso del color 
en una respuesta se codifica con C (color), CF 
(color/forma) o FC (forma/color), dependien- 
do de si la forma cstd total mente ausentc, es 
primaria o secundaria al color como determi- 
nante. Tambidn se codifica el contenido del 
percepto, por ejemplo H (humano), Hd (dctalle 
humano), An (anatomfa), Cg (vestimenta) y de- 
mds (cuadro 13-4). La calificacidn apropiada 
del Rorschach requiere entrenamiento y super- 
visidn extensas; aquf sdlo se han tocado unos 
cuantos aspectos bdsicos. 

Es lamentable que Rorschach haya muerto 
antes de complctar sus metodos de calificacidn, 
de modo que la sistematizacidn de la califica- 
cidn de la prueba le quedd a sus seguidores. 
Cinco psicdlogos cstadounidenses produjeron 
enfoques superpucstos, pero independientes, 
para la prueba —Samuel Beck, Marguerite 
Hertz, Bruno Klopfcr, Zygmund Piotrowski y 
David Rapaport (Erdberg, 1985). Como podrfa 
predecirse, los malices de la calificacidn varfan 
de un mdtodo a otro. Por fortuna, Exner y sus 
colaboradores han sintetizado estos enfoques 
anteriores dentre de un Sistema comprensivo de 
calificacidn (Exner, 1991,1993; Exner y Weiner, 
1994). Este sistema se fundamenta mejoren la 
investigacidn empfrica y ha recmplazado con 
toda claridad a los demds enfoques para la cali¬ 
ficacidn de la prueba. 

Una vez que se ha codificado el protocolo 
completo, el examinador puede calcular varias 
calificaciones de resumen que forman la pri- 
mera base para las hipdtesis sobre la personali- 
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Cuadro 13-4. Resumen de los principales criterios de calificacidn del Rorschach 

L Localizacidn: ^En qud parte de la mancha se localizd el percepto? 


w 

Completa 

Se utilizes toda la mancha de tinta 

D 

Detalle comun 

Se utilizd una parte bien delinida 

Dd 

Oetalle inusual 

Se utilized una parte inusual 

S 

Espacio 

Percepto definido por espacio en bianco 

Determinante: iQud caracterfstica de la mancha determind la respuesta? 

F 

Forma 

Aspecto o perfil utilizado 

F+ 

Forma + 

Excelento equiparacion entre percepto y mancha de tinta 

F- 

Forma - 

Equiparacidn muy deficiente entre percepto y mancha de tinta 

M 

Movimiento 

Movimiento visto o implicito en el percepto 

C 

Color 

El color ayudd a determinar la respuesta 

T 

Textura 

El sombreado se incluye en la respuesta 

Contenldo: ^Qud es el 

percepto? 

H 

Humano 

Percepto de lorma humana completa 

Hd 

Detalle humano 

Forma humana incomplela en algun sentido 

Ex 

Explosidn 

Una explosidn en sf 

xy 

Rayos X 

Radiograffa de cualquier parte humana; implica sombreado 

Popular contra original 


P 

Popular 

Respuesta dada por muchas personas normales 

O 

Original 

Respuesta rara y creativa 


Nota: Este cuadro represents un consenso de todos los princpales sistemas de calificacidn La lisla es Incomplete y sdto Hustraliva 
Los sistemas complelos de calilicac*6n son muy complejos y permiten combinaoones, por ejempto, FM. CF, WS-, Oo Para mayores 
ejemptos vdase Exner, J. E , Jr. (1993) The Rorschach: A comprehensive system. Volume I. Basic foundations (3a ed ) Nueva Yortc 
Wiley 


dad del individuoevaluado. Porcjcmplo, el por- 
centajc de F+ es la proporcion del total de res- 
pucstas que utilizan la forma pura como 
dcterminante. Existe una litcratura voluminosa 
acerca del significado de este fndice, pero pa- 
rece scguro hipotctizar que cuando cl por- 
centaje de F+ cac por debajo de 70%. el exa- 
minador deberfa considcrar la posibilidad de 
psicopatologfa, organicidad o deficit intelectual 
graves en la persona examinada (Exner. 1993). 
El porcentaje de F+ sc considera tambidn como 
un fndice de la fortaleza del yo, donde las cali- 
ficaciones mds altas indican mayor capacidad 
para enfrentarse de manera eficaz al estrds. No 
obstante, en el mejor de los casos se puede de- 
cir que existe evidcncia a favor y en contra de 
esta conjetura. 


Frank (1990) ha enfatizado que la califica¬ 
cidn formal del Rorschach es insuficiente para 
algunos propdsitos, como el diagndstico de la 
esquizofrenia. Este autor destaca que un andli- 
sis del pensamiento del pacientc en busca de la 
presencia de asociaciones sumamente persona¬ 
tes, ildgicas y extranas hacia las manchas de 
tinta es cscncial para el psicodiagndstico. Des- 
de su enfoque, el Rorschach es en realidad un 
auxiliar de la entrevista y no una prueba en sf. 

COMENTARIO SOBRE EL RORSCHACH 

Debido a una variedad de razones, es diffcil 
ofrecer general izaciones concisas acerca de la 
confiabilidad, validez y utilidad clfnica del 
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Rorschach. Incluso las preguntas sencillas pro- 
vocan respuestas complejas. Por ejcmplo, ^cuil 
es el propdsito de una evaluacidn con el 
Rorschach? En dpocas sucesivas de investiga¬ 
tion, esta prucba se ha utilizado para oblencr 
un diagndstico psiquiitrico, estimar el pronds- 
tico de la psicoterapia, obtcner un fndicc del 
proceso primario de pensamiento, predccir cl 
suicidio y formular estructuras complejas de 
personalidad, por nombrar sdlo unas cuanlas 
aplicaciones (Peterson, 1978). El propdsito del 
Rorschach csti (an mal definido quc inclusive 
algunos de sus partidarios cvilan considcrarlo 
como una pmeba y cn vez de cllo prefiercn de- 
nominarlo un mdtodo para generar informacidn 
accrca del funcionamiento de la personalidad 
(Weiner, 1994). Cuando cl propdsito de un ins- 
trumento es poco claro, la investigacidn objetiva 
sobrc sus atributos psicomdtricos es aniesgada 
tanto como diffcil. Peer aun, la investigacidn 
objetiva puede carecer de sentido, dado que 
aqucllos que to apoyan ignorarin las conclu- 
siones contrarias, mientras que los detractores 
no utilizan la prueba de todos modos. 

Un cstudio de Albert, Fox y Kahn (1980) 
acerca de la susceptibilidad del Rorschach a la 
falsificacidn, es tfpico de la investigacidn so- 
bre este instrumento. Se recuerda al lector que 
existen miles de estudios de investigacidn den- 
tro de la literatura, incluyendo muchos con con- 
clusiones positivas (p. ej., Hilsenroth, Fowler, 
Padawer y Handler, 1997; Smith, Gacono y 
Kaufman, 1997; Weiner, 19%). Pero los rcsulta- 
dos heterogeneos quc presentaron Albert, Fox y 
Kahn (1980) son rods comunes. Estos investiga- 
dores somelieron los protocolos del Rorschach 
de 24 personas a un panel de expertos, a quicnes 
pidieron sus diagn6sticos psiquiitricos para ca- 
da individuo. Los 24 protocolos del Rorschach 
consistieron de los resultados de cuatro gru- 
pos con seis personas cada uno: 

• Pacientes de un hospital para enfermcdadcs 
mcntalcs con un diagndstico de esquizofrenia 
paranoide. 

* Falsificadores no informados a quienes se dio 
la instruccidn de falsear las respuestas de un 
csquizofrdnico paranoide. 


• Falsificadores informados que escucharon una 
cinta de audio detallada accrca de la esquizo¬ 
frenia paranoide. 

• Controlcs normalcs quc rcalizaron la prueba 
bajo condiciones estindar. 

Los falsificadores no informados, los informados 
y los controles normales eran estudiantes que 
habi'an pasado por una prueba de deteccidn con 
el MMPI y a quienes, durante una entrevista, 
se les habi'a considerado como razonablcmcnte 
normalcs. De 6 a 9 jueces, todos miembros de 
la Society for Personality Assessment, califica- 
ron los protocolos. A dstos sc les dijo que pro- 
porcionaran un diagndstico psiquiitrico asf 
como otra informacidn quc no se proporciona 
aquf. No se les informd el propdsito del estu- 
dio, pero sc les dijo que evaluaran si parccfa 
haber simulacidn en cualquiera de los perfiles. 

Los falsificadores informados debieron ha¬ 
ber hecho un excelente trabajo porque fue mis 
probable que se les diagnosticara como psiedti- 
cos quc a los pacientes reales en sf (72% contra 
48%, rcspeclivamcnte). Los falsificadores no 
informados fueron tambidn bastantc convincen- 
tes, con una tasa de 46% de diagndstico de psi- 
cosis. Los controles normales sc diagnosticaron 
como psicdticos en 24%. Sc concede que cl rcto 
diagndstico de este estudio era inmenso, pero 
de todos modos sigue siendo perturbador en- 
contrar que jueces expertos calificaron a 24% 
de los protocolos normales como psicdticos, 
mientras quc idcntificaron psicosis en sdlo 48% 
de los protocolos psicdticos reales. Un cstudio 
mis reciente de Ncttcr y Viglionc (1994) tam- 
biln concluyd que el Rorschach es susceptible 
a la simulacidn de psicosis. 

Aunque existen excepciones dignas de 
mencidn en la evaluacidn del Rorschach, un sus- 
tancial numero de estudios apunta a una baja 
confiabilidad y a una falta general de validez 
prcdictiva (Carlson, Kula y St. Laurent, 1997; 
Peterson, 1978; Lanyon, 1984; Wood, Nezworski 
y Stejskal, 1996). En una rcsefia mctaanalftica, 
Garb, Florio y Grove (1998) concluyeron que 
el Rorschach cxplicaba un atroz 8 a 13% de la 
varianza en las caracterfslicas del cliente, en 
comparacion con el MMPI, el cual explicaba 
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de 23 a 30% dc la varianza. Desde una perspec- 
tjva positiva, estudios recientcs basados en las 
mcjorfas cn calificacidn quc ofrecc cl cnfoquc dc 
Exncr son un tanto mAs positivas cn sus resul- 
tados (vease Exncr, 1995; Exncr y Andronikof- 
Sangladc, 1992; Meyer, 1997; Ombeig y Zalewski, 
1994; Piotrowski, 1996). Sin embargo, el 
Rorschach todavfa no obticne el nivel dc rcs- 
petabilidad cicniiTica quc disfrutan otras prue¬ 
bas de pcrsonalidad y quiz;! nunca lo logre. 

TECNICA HOLTZMAN DE MANCHAS 
DE TINTA 

Wayne H. Holtzman bused superar las princi- 
palcs limitacioncs del Rorschach al dcsarrollar 
una tdcnica complctamcntc nueva quc uiiliza 
manchas de tinta con proccdimientos simplifi- 
cados para su aplicacidn y calificacion. En la 
Holtzman Inkblot Technique, HIT (Tdcnica 
Holtzman dc Manchas dc Tinta), la persona exa- 
minada se limita a una rcspucsta por I Amina, 
pero se le presenta una scrie dc 45 lAminas. A 
cada respuesta le siguc una prcgunta dual muy 
sencilla: ^ddnde se encuentra representado el 
perccpto dentro de la mancha y que aspecto de 
tfsta lo sugirid? 

La HIT puedc obtenerse cn dos formas pa- 
ralclas, construidas de manera cuidadosa. La 
existencia de formas paralelas cs invaluable 
para los estudios test-retest, ya que es frecuen- 
tc que las personas examinadas recucrdcn sus 
respuestas dadas a una (Amina y, por tanto, 
ofrezean la misma rcspucsta de manera mecA- 
nica cuando se les vuclve a examinar. Las 45 
respuestas dc la HIT sc califican cn cuanto a 
22 variables diferentes, obtenidas de los ante- 
riorcs sistemas de calificacidn del Rorschach. 
Las variables de calificacidn de la HIT se des- 
criben en el cuadro 13-5. 

El sistema dc calificacidn de la HIT es su- 
mamente confiablc y la cstandarizacidn del ins- 
trumento parece adecuada. Cuando se emplea 
a calificadores bien entrenados, la concordan- 
cia intercalificadorcs para las diferentes cate- 
gorfas es de .95 a 1.00 para la mayor parte de 
ellas; sdlo Penetracidn e Integracidn caen por 
debajo de esta norma. Las confiabilidades 


por mitadcs tambien son accplables, con valo- 
res medianos en los rangos de .70 y .80. La cs- 
tabilidad test-retest con formas paralelas es 
adecuada en tdrminos generalcs, aunque algu- 
nas categorfas (Localizacidn, con r de .81) tic- 
nen mejor desempefio que otras (Popular, con 
r de .36). Las normas pcrcentilares para cada 
categorfa de calificacidn sc presentan por se- 
parado para cstudiantes universitarios (N = 
206), adultos promedio (A/ = 252), ninas dc se¬ 
cundaria (N = 197), ninos de escuela primaria 
(N = 132), niiios de cinco afios de edad (N = 
122), esquizofrdnicos crdnicos (N = 140), pa- 
cientes con depresidn (N = 90) y personas con 
rctraso mental (N = 100). 

Varios cientos de estudios de investigacidn 
que se han dirigido a la validez de la HIT infor- 
man sobre la relaci6n entre las calificaciones 
de la prueba y medidas independientes de per- 
sonalidad (Hill, 1972; Holtzman, 1988; Swartz, 
Reinehr y Holtzman, 1983). En general, las 
reiaciones son modcstas, pero sustentan la va¬ 
lidez dc la HIT, en especial como auxiliar para 
cl psicodiagndstico. 

Una variacidn recicntc dc la HIT rcquicrc 
dos respuestas para cada una de las 25 I Aminas 
de un subconjunto cuidadosamente selcccio- 
nado de la Forma A. Llamada la HIT 25 para 
distinguirla de la HIT estAndar, esta nueva prue¬ 
ba constituyc una promesa excepcional para 
ayudar al diagndstico de la esquizofrenia. Al 
utilizar critcrios de calificacidn de gran objeti- 
vidad y rcglas simples dc dccisidn, la HIT 25 
clasificd dc manera objetiva a 26 dc 30 esqui- 
zofrenicos y a 28 dc 30 estudiantes universita¬ 
rios normales (Holtzman, 1988). Los criterios de 
decisidn consistcn dc cuatro reglas para conclu- 
siones normales, que se califican con +1 cada 
una, y 13 rcglas para conclusiones de esqui¬ 
zofrenia, que se califican como -1 cada una. 
Los resultados (otales se suman dc manera 
algebraica, lo cual produce una calificacidn de 
“normalidad". Esta es la base para decisioncs 
diagndsticas simples. Las calificaciones por 
arriba dc cero sugieren normalidad, mientras 
que las infcriorcs a cero indican esquizofrenia: 
una calificacidn deceroes indeterminada. La HIT 
25 parece prometedora, pero se necesilan espe- 
cialmente estudios sobre validacidn cruzada. 
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Cuadro 13-5. Nombres y descripciones de las variables 
en Tecnica Holtzman de manchas de tinta 


Tiempo de reaccidn: 

Tiempo en segundos desde la presentation de la mancha de tinia 
hasta el inldo de la primera respuesla. 

Rechazo: 

El individuo no informa nada o regresa la mancha de tinia al exa- 
minador. 

Locallzacldn: 

Calificada en un sistema de 3 puntos: 0 -mancha completa, 1 -Area 
grande, 2 -Area pequena. 

Espacio: 

Calificado cuando existe una verdadera inversidn figura-fondo: la 
parte en bianco constituye la figura. 

Definicidn de forma: 

Calificada en un sistema de 5 puntos desde 0 (concepto sin forma, 
p. ej., mancha de pintura) hasta 4 (concepto sumamente formado, 
p. ej., centauro). 

Idoneidad de forma: 

Bondad de ajuste del concepto a la forma de la mancha de tinia; 0 
-deficiente, 1 -adecuada, 2 -buena. 

Color: 

El color es el principal determinante, en general lo menciona el su- 
jeto; se califica de 0 a 3. 

Sombreado: 

El individuo hace referenda al sombreado (borroso, con lextura) 
como un determinante; se califica de 0 a 2. 

Movimiento: 

Se califica cuando la respuesla implies energia o una cualidad de 
movimiento dinAmico; se califica de 0 a 4. 

Verballzacidn patognomdnica: 

Verbalizaclones incoherentes, raras, absurdas. autorreferenciales, 
etc., ante las lAminas. 

Integracidn: 

Calificada con 1 si dos o mAs elementos de la mancha se integran 
efectivamente en la respuesla; de otra manera se califica con 0. 

Calificaciones de contenido: 

Cada categorfa (Humano, Animal, Anatomia, Sexo, Abstracto) se 
califica de 0 a 2 con base en ausencia, presertcia parclal o presencia 
completa del concepto. 

Ansiedad: 

Cada respuesla se califica de 0 a 2 en cuanto a signos de ansiedad 
(p. ej., cueva oscura y peligrosa). 

Hostilidad: 

Cada respuesta se califica de 0 a 3 en cuanto a signos de hostilidad 
(p. ej., mariposa destrozada). 

Barrera: 

La barrera se refiere a cualquier cobertura. membrana, concha o piel 
protectors que pudiera relacionarse a nivel simbdlico con Kmites 
de imagen corporal; 1 si estA presente, 0 si estA ausente. 

Penelracidn: 

Se califica con 1 si el concepto es sfmbolo de que el individuo exa- 
minado siente que algo puede penelrar con facilidad su cuerpo ex¬ 
terior; de otro modo se califica con 0. 

Equillbrio: 

Se califica con 1 si la persona hace referenda a la presencia o ausen¬ 
cia de simetria en el diseno; de otro modo se califica con 0. 

Popular 

Se califica con 1 si la respuesta es comun, observada en 1 de 7 
protocolos normativos. 


Fuanto: Ba&ado on Holtzman, W H, (1961) Guide to admmslralion and scoring: Holtzman Inkblot Technique New Yortt The 
Psychological Corporation 
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fe' : TECNICAS DE COMPLETAMIENTO 


pruebas de frases incompletas 

En una prueba de frases incompletas, se pre- 
senta a la persona examinada una seric de par¬ 
tes de frases que se forman de unas cuantas 
palabras del inicio de la misma y la (area con- 
sistc en dar las terminaciones. Como con cual- 
quier tdcnica proyectiva, cl examinadorsupone 
que las oracioncs terminadas reflejan las moti- 
vaciones, actitudcs, conflictos y tcmorcs sub- 
yaccntcs de la persona que responde a la prueba. 
En general, las pruebas de frases incompletas 
se pueden interprclar de dos maneras diferentes: 
andlisis subjetivo-intuilivo de las motivacioncs 
subyaccnlcs proyectadas en las respuestas del 
individuo o andlisis objetivo por medio de cali- 
ficacioncs asignadas a cada oracidn terminada. 

En la figura 13-3 se presenta un ejemplo 
de una prueba de completamicnto de frases. 
feta es bastante similar a los instrumentos exis- 
(entes en cuanto a que las partes de la frasc son 
muy cortas y se rcstringen a un pequcfio nume- 
ro de temas bdsicos. El lector observard que en 
esta prueba corta se repiten tres temas (auto- 
concepto, la madre y el padre de la persona que 
responde). De esta manera, el individuo exami- 
nado tiene multiples oportunidades de revelar 
sus motivaciones subyaccntes acerca de cada 
tema. Por supuesto, la mayor parte de las prue¬ 


bas de frases incompletas son mds grandes 
—enlrc 40 y 100 partes de una frasc— y con- 
lienen mds temas —de 4 a 15 temas. 

Se han desarrollado docenas de pruebas de 
frases incompletas. la mayor parte de las cua- 
les son instrumentos no publicados y sin es- 
tandarizarque sc produjeron para salisfacer una 
necesidad clfnica espccifica. En cl cuadro 1J-6 
se describen algunas de las pruebas de com- 
plctarrucnto de frases mds destacadas y que to- 
davfa cstdn en uso. De eslos instrumentos, la 
Prueba de la Universidad de Washington de 
Frases Incompletas, crcada por Loevinger, es 
la mds complcja y tcdricamenle fundamentada 
(p. ej.. Weiss. Zilberg y Gcnevro, 1989). No obs¬ 
tante, el Roller Incomplete Sentences Blank 
(Formulario de frases incompletas de Rotter) 
tiene la sustentacitSn cmpirica mds fuertc y es 
la de mds amplia utilizacidn en ambicnles clfni- 
cos. Se analiza en mds dctalle estc instrumento. 

FORMULARIO DE FRASES INCOMPLETAS 
DE ROTTER 

El Roller Incomplete Sentences Blank (RISB) 
consiste en tres formas similarcs: cducacion 
media, universitaria y adulta; cada una de las 
cuales conticne 40 partes de frases cscritas en 
su mayor parte en primera persona (Rotter y 
Rafferty, 1950; Rotter. Lah y Rafferty, 1992). 
Aunquc la prueba puede interpretarse subjeti- 
vamente de la manera comun, a travds de un 


liwtruooones Tormina estaa (rases para Indicar edmo se siente usted 

1. Mr melor caraderlstlca ea_ 

2. Mi madre _ _ 

3. Mi padre __ 

4 Mr mayor temor ea __ 

5 Lo mejor de mi madre era_ 

6. to major de mi padre era __ 

7. Esloy orguftoso(a) de_ 

8. SOto quisiera que ml madre hublera__ 

9. Sdlo quisiera que mi padre hubiera __ 


Figura 13-3. Ejemplo de una prueba corta de frases Incompletas. 
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Cuadro 13-6. Resumen de pruebas 
importantes de (rases incompletas 


Bloom Sentence Completion Survey (BSCS) 
(1974-1975) (Examen de Frases Incompletas 
de Bloom), Stoelting Co. 

El BSCS puede oblenerse en una forma con dos 
nlveles (estudianles o adultos). Cuarenta paries 
de frases producen calificaciones en ocho Areas: 
companeros por edad (estudianles) o personas 
(adullos), sf mismo ffsico, familia, sf mismo psi- 
colAgico, independencla, educacidn (estudianles) 
y trabajo (adullos), logros e irritanles. 

Activity Completion Technique (1984) (TAcnica 
de Completamiento de Actividad), 
Psychological Assessment Resources 
La ACT consisle de 60 paries de frases y cubre 
cualro Areas: Familia, Interpersonal, Afecto y 
Autoconcepto. El manual revisa un anAlisis de con- 
lenido de las respueslas con orientaciAn clinica 
dentro de cada Area. La prueba lambien emplea 
un sistema semiobjetivo de calificaciAn para pro- 
ducir una Escala de calilicaciAn de adaptaciAn. 

Incomplete Sentences Task (1ST) (1979-1980) 
(Tarea de Frases Incompletas), Stoelting Co. 
La 1ST consisle de dos formas (niveles bachille- 
ralo y universidad) con 39 reactivos sumamente 
estructurados, vinculados a la conducta, que se 
disenaron en especial para evaluar hostilidad, 
ansiedad y dependencia. 

Geriatric Sentence Completion Form (1982) 
(Forma geriAtrica de Frases Incompletas), 
Psychological Assessment Resources 
La GSCF es una forma con 30 reactivos diseftada 
especfficamento para utilizarse con clientes adultos 
mayores. Esta prueba obtiene respueslas perso¬ 
nates dentro de cuatro dominios de contenido: 
ffsico, psicolAgico, social y de orientaciAn tem¬ 
poral. El manual de la prueba incluye varios 
ejemplos clfnicos. 

Washington University Sentence Completion 
Test (Prueba de oraclones Incompletas do la 
Universidad de Washington), publicada de 
manera privada por Loevinger (1976,1979) 

La WUSC uliliza formas independientes para va- 
rones, mujeres y varones y mujeres mAs jAvenes. 
Esta prueba liene una vinculaciAn muy fuerte con 


Cuadro 13-6. Resumen de pruebas 
importantes de frases incompletas 
(continuacibn) 


la teorfa; las respueslas se clasitican segun siete 
etapas de desarrollo del yo; prosocial y simbiAtica, 
impulsiva, autoproteclora, conformista, escrupulo- 
sa, autAnoma, Integra. 

Miner Sentence Completion Scale (Escala 
Miner de oraciones incompletas) (Miner, 1964, 
1986), Organizational Measurement Systems 
Press 

La MSCS consisle de Ires formas, Incluyendo ta 
Forma H original que se publicA inicialmente en 
1964. La prueba se dirige a empleos administra- 
tivos, profesionales y orientados a las ventas. La 
Forma Hes unica en proporcionar una alternaliva 
de opciAn multiple; las nueve subescalas induyen 
dimensiones relacionadas con el trabajo como 
Figuras de autoridad, Situaciones competitivas y 
Rol asertivo. 


anAlisis cualitativo de las nccesidadcs proyec- 
tadas en las respueslas del individuo, cs la cali- 
ftcaciAn objetiva y cuantitativa del RISB la que 
ha atrai'do mayor atenciAn. 

En cl sistema objetivo de califtcaciAn, cada 
una de las frases completadas recibe una califi- 
caciAn de adaptaciAn de 0 (buena adaptaciAn) 
a 6 (adaptaciAn muy dcficicnte). list as se basan 
de inicio en la siguiente categorizat ion de cada 
respuesta: 

• Omision -no hay respuesta o dsta es dema- 
siado corta como para tener significado. 

• Respuesta de conflicto -indicative de hosti¬ 
lidad o infelieidad. 

• Respuesta posit!va -indicativa de actitud po- 
sitiva o esperanzada. 

• Respuesta neutra -aftrmaciones declarativas 
que no demucstran afecto positivo ni negativo. 

Ejemplos de las ultimas tres categonas incluyen: 

Odio... a todo el mundo (respuesta de 
conflicto). 

Lo mejor... aun cstA por venir (respuesta 
positiva). 

La mayorfa de las nihas... son mujeres 
(respuesta neutra). 
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Las respuestas de conflicto se califican con 4, 
5 o 6, del menor al mayor grado de conflicto 
expresado. Las rcspuestas positivas se califican 
como 2, 1 o 0, dc la menos positiva a la mis 
positiva. El manual proporciona ejemplos de 
cada catcgorfa de calificacidn. La califlcacidn 
total de adaptacidn se obticne al sumar las cali- 
ficaciones ponderadas en las catcgorias de con- 
flicto y positiva. La calificacidn dc adaptacidn 
puedc variar dc 0 a 240, donde las calificacio- 
nes mis altas indican mayor desadaptaci6n. 

La confiabilidad de la calificacidn dc adap- 
tacidn es cxccpcionalmcnte buena, incluso 
cuando la obtienen asistcntcs con conocimien- 
tos psicoldgicos mfnimos. Por lo comun, las 
confiabilidadcs intercalificadorcs sc cncucntran 
en el rango de .90 y los cocficicntes por mita- 
des estin cn el rango de .80 (Rotter, Lah y 
Rafferty, 1992; Rotter, Rafferty y Schachtitz, 
1965). La validcz dc este fndice se ha investi- 
gado en numerosos cstudios que emplean cl 
RJSB como instrumento de deteccidn con una 
puntuacidn de corte para la “desadaptacidn". 
Por ejemplo, se ha encontrado que una puntua- 
ci6n de corte de 135 detecta de manera correcta 
a los dclincucntcs juveniles en 60% de las oca- 
siones, mientras que tambidn idcntifica corrcc- 
tamentc a los jdvenes no delincuentcs en 73% 
de las vcccs (Fuller. Parmelec y Carroll, 1982). 
Las mismas puntuacioncs dc corte identifican 
a los individuos con fuertc abuso de drogas en 
80 a 100% de las ocasioncs (Gardner, 1967). 
6stas y otras conclusioncs similarcs sustentan 
la validez de constructo del (ndice dc adaptacidn. 
pero tambidn indican que las tasas de clasifica- 
cidn son mucho mis bajas que las necesarias 
para la loma de decisiones individuates o la dc- 
teccidn cficaz. Tambidn parece que las normas 
del fndice dc adaptacidn son anlicuadas. Lah y 
Rotter (1981) encontraron que las califtcacioncs 
actuates de los estudiantes difteren de manera 
significativa de las obtenidas en el estudio ori¬ 
ginal de Rotter y Rafferty (1950). Lah (1989) y 
Rotter, Lah y Rafferty (1992) proporcionan 
nuevos datos normativos, de calificacidn y de 
validez para el RISB. 

Como propone Goldberg (1965), la senci- 
llezdc la calificacidn unica de adaptacidn cons- 


tituye tanto la fortalcza como la debilidad de la 
prueba. Es cierto, el instrumento proporciona 
un mdtodo ripido y eficaz para obtener un fn¬ 
dice general del funcionamiento cotidiano dc 
las personas. No obstante, una sola calificacidn 
no tiene posibilidades dc captar los matices 
del funcionamiento de la personalidad. Ademis, 
cl RISB csti sujeto al mismo tipo de sesgo que 
otras medidas dc autoinformc; es decir, la in- 
formaci6n reflejari principal mente aquello que 
la persona que responde quierc que cl examina- 
dor sepa (Phares, 1985). 

ESTUDIO ROSENZWEIG DE 
FRUSTRACI6N POR ILUSTRAQONES 

El Rosenzweig Picture Frustration Study (Es¬ 
tudio Rosenzweig de Frustracidn por Ilustra- 
cioncs; Estudio P-F) se considcra con frecuencia 
como una tdcnica semiproyectiva que rcquierc 
que el examinando produzca una respuesta ver¬ 
bal a un estfmulo verbal-pictdrico sumamente 
estructurado. El Estudio P-F se puede obtener 
en tres formas —nihos, adolescentes y adul- 
tos— cada una dc las cualcs consiste de 24 
ilustraciones de lira comica que representan una 
circunstancia frustrante (Rosenzweig, 1977, 
1978a). Cada limina conliene dos personas, 
donde la que se encuentra a la izquierda expre¬ 
ss palabras que provocan o describen una si- 
tuacidn frustrante para la persona a la dcrccha 
(figura 13-4). Al individuoexaminadose le pidc 
que indique, al escribir cn el globo que se en¬ 
cuentra arriba dc la cabeza de la persona frus- 
trada, la primera respuesta que le venga a la 
mente como expresada por la figura andnima 
dc la caricature. En el caso dc los individuos 
mis jdvcncs, el examinador escribe la respues¬ 
ta de la persona. 

El propdsito del Estudio P-F consiste en 
cvaluar la manera caractcrfstica en que la per¬ 
sona examinada reacciona ante la frustracidn. 
Esta se define como aquello que ocurrc cuando 
el organismo se enfrenta con un obsticulo u 
obstruccidn en su camino a la satisfaccidn dc 
una nccesidad (Rosenzweig, 1944). En sentido 
general, es bien sabido que las personas reac- 
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Figure 13-4. Reactivo de muestra del Estudio Rosenzweig 
de Frustracibn por llustracionos. 

Copyright © de Saul Rosenzweig. Reproducido con 
autorizacidn. 

cionan a la frustracibn con agresibn. El valor 
del Estudio P-Fes su conccptuacibn multifacb- 
tica de la agresibn, segun ires direcciones y trcs 
tipos. La direccibn de la agresibn puede ser 
extragresiva; es decir, volcada hacia cl ambien- 
te; intraagresiva (o sea, volcada por la persona 
examinada hacia si mismo), o imagresiva o evi- 
lada cn un intento por disimular la frustracibn. 
El tipo de agresibn puede ser con dominio del 
obstaculo, en el cual se destaca en la respuesta 
la barrera que ocasiona la frustracibn; en de- 
fensa del yo, en la cual la capacidad de organi- 
zacibn de la persona examinada predomina cn 
la respuesta; o de persistcncia de la necesidad, 
en la que se enfaliza la solucibn de la situacibn 
frustrante al seguir hacia la meta a pesar del 
obstdculo (Roscnzweig, 1978b). Es importan- 
te scnalar que la agresibn no necesariamente es 
un constructo negativo. Los tipos de agresibn 
de persistence de la necesidad representan for¬ 
mas construclivas, y en ocasiones creativas, de 
agresibn, mientras que la agresibn en defensa 
del yo es con frecuencia dcslructi va (de otros o 
de uno mismo). 

El Estudio P-F se califica al de detectar uno 
o dos de los factorcs cn cada respuesta indivi¬ 


dual. Se evitan las intcrpretaciones profundas y 
el manual contienc muestrasde calificacibn para 
ayudar en la toma de decisiones. Cuando sc 
han contado las calificacioncs de los rcactivos, 
se llcna el formulario de calificacibn calculando 
el porcentaje de las nueve categorfas de califi¬ 
cacibn que ocurrieron cn el protocolo de la per¬ 
sona evaluada. Tambien se cucnlan los tipos y 
direcciones generates de la agresibn, lo cual da 
por rcsullado IS Indices. Adembs se puede cal- 
cular una Calificacibn de conformidad con cl 
grupo (GCR). La GCR indica el grado de co- 
rrespondencia entre las rcspucstas del indivi- 
duo examinado y aqubllas dadas con mbs 
frecuencia por la muestra normative. Todos los 
indices pueden compararse con los rcsulta- 
dos de muestras apropiadas de cslandariza- 
cibn. Por supucsto, adembs de la calificacibn 
cuantitativa, las respuestas al Estudio P-F pue¬ 
den evaluarsc de manera impresionista. 

La confiabilidad intercalificadorcs del Es¬ 
tudio P-F se presenta en el rango de .80 a .85 
para examinadores bien entrenados y escrupu- 
losos. Sin embargo, la cstabilidad test-retest del 
instrumento se encuentra en algbn punto entre 
promedio y marginal. Por ejemplo, las corrcla- 
cioncs retest para las categorfas de calificacibn 
en la forma adulta del Estudio P-F van de .21 a 
.71. donde la mayor parte de los valores se co- 
locan cn cl rango de .40 (Rosenzweig, 1978b). 
Una enormc cantidad de estudios de validacibn 
se encuenlran resumidos en varias publicacio- 
nes (Rosenzweig, 1977, 1978b; Rosenzweig y 
Adelman, 1977). Con base en las confiabilidades 
muy modestas de las categorfas de calificacibn, 
se coincide en que cl Estudio P-F es mbs apropia- 
do para la investigacibn que para la evaluacibn 
individual (Graybill y Heuvelman, 1993). 


|V TECNICAS DE CONSTRUCCI6N 


TEST DE APERCEPCION TEMAT1CA (TATI 

La TAT consiste de 30 iluslraciones que repre¬ 
sentan una variedad de cuestiones y temas en 
dibujos y fotograffas en bianco y negro; una de 
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las I6minas est£ en bianco. La mayor parte 
de las Idminas represcntan a una o mas perso¬ 
nas quc participun en actividades ambiguas. Al- 
gunas se emplean con varones adultos (H), 
mujcrcs adultas (M), nifios varones (V), nifias 
(N) o en alguna combinacidn (p. ej., VH). En 
consccucncia, exactamente 20 lemmas son ade- 
cuadas para cada examinando. 

En la figura 13-5 se mucstra una ilustra- 
cion similar a las utilizadas en la TAT. Al apli- 
car esta prueba, cl cxaminador le pide a la persona 
examinada que invente una historia dramatica 
para cada Idmina, en la que cxpliquc aquello que 
condujo a la cscena actual, que succdc en cse 
momento, qud picnsan y sienten los personajcs 
y cudl serd el desenlacc. El cxaminador escribe 
la historia al pie de la letra para posterior califi- 
cacidn y andlisis. 

Henry Murray y sus colaboradorcs clabo- 
raron el TAT en la Clfnica psicoldgica de 
Harvard (Morgan y Murray. 1935; Murray, 
1938). La prueba se disend originalmcnte para 
e valuar constructos como necesidadcs y prcsio- 
ncs, que son elemcntos centrales de la teorfa de 
personalldad de Murray. Scgun este autor. las 
necesidades organizan la percepcidn, pensa- 
miento y accion y dan la energfa a la conducta 



Figura 13-5. Ilustracidn similar a aqubllas del Test de 
apercepckJn tematica. 


en direccidn de su satisfaccidn. Ejemplos de 
necesidadcs incluyen aqudllas de logro, de afi- 
liacidn y de dominio. En contraste, las presio- 
nes sc reficrcn al poder de los acontccimientos 
ambientaies para influir sobre la persona. La 
presidn alfa la forman las fuerzas extemas ob- 
jetivas o “rcalcs”, mientras que la presidn beta 
ticne que vercon los componentes subjetivos o 
pcrcibidos de las fuerzas extemas. Murray 
(1938, 1943) desarrolld un claborado sistema 
de calificacidn del TAT para medir 36 necesi¬ 
dades diferentes y diversos aspectos de la pre¬ 
sidn, como se revclan en las historias de la 
persona examinada. 

Casi tan pronto como Murray publied el 
TAT. otros clfnicns comenzaron a desarrollar 
sistemas altcrnativos dc calificacidn (p. ej., 
Dana, 1959; Eron, 1950; Shncidman, 1951; 
Tomkins, 1947). La litcratura sobre aplicacidn, 
calificacidn e interpretacidn del TAT florecid 
de mancra extensa, como lo documcntan las 
revisiones recientes (Aiken, 1989, cap. 12; 
Groth-Marnat, 1997; Ryan, 1987; Weiner y 
Kuehnlc, 1998). Para el dccenio dc 1950, no 
existfa un modo preferido de aplicacidn, como 
tampoco un solo sistema favorito de califica¬ 
cidn y ningun metodo predilccto de interpre¬ 
tacidn. una situacidn que todavfa cxiste hoy en 
dta. Incluso, los clfnicos varfan en cl fraseo 
de las instruccioncs y por lo comun eligen un 
subconjunto individualizado de Idminas del 
TAT para cada cliente. De hecho, la ausencia 
de procedimientos estandarizados es tal que en 
rcalidad deberfa considerar.se al TAT como un 
mdtodo y no como una prueba. 

Es necesario mcncionar que las instruccio- 
nes de Murray incluian una declaracidn de que 
el TAT era “una prueba dc la imaginaci6n, la 
cual es una forma de inteligencia” y udemas 
estipulaba quc: 

Voy a mostrarle algunas ilustracionos, una a la 
vez, y su (area conslstira en inventar una histo¬ 
ria tan dramatica como pueda para cada una. 

Oiga que ha conducido al acontecimiento que se 
muestra en la imagen, describa qua esta suce- 
diendo en el momento, que sienten y plensan los 
personals y despues diga ol desenlace. Expre- 
se sus pensamientos como le vengan a la mon¬ 
te. tComprende usted? Ya que tiene 50 minutos 
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para las 10 ilustraciones, la puede dedicar cerca 
de cinco minutos a cada hlstoria (Murray, 1943). 

En la actualidad, los clfnicos le han restado im- 
portancia al dnfasis cn la imaginacidn y la 
inteligcncia cuando dan las instruccioncs. Con 
toda scguridad csta omisidn debe influir cn la 
calidad de las historias producidas. 

Aunquc sc han propucsto m&s de una do- 
cena dc sistcmas de calificacidn, en general la 
intcrpretacidn del TAT se basa en un analisis 
clfnico-cualitativo de las producciones. Una 
consideracidn central tienc su origen en la su- 
posicidn de Murray acerca del “hdroe". Segun 
esta pcrspecliva, dstc cs el protagonista de la 
historia de la persona cxaminada. Se suponc 
quc el individuo se identifica claramentc con 
su personaje y proyecta en dl sus propias nece- 
sidadcs, esfuerzos y senlimicntos. A la invcrsa, 
los pcnsamientos, senlimicntos o acciones que 
evita el hdroe pucden representar drcas de con- 
flicto para la persona examinada. Un ejemplo 
espccffico ayudard a aclarar eslos punlos. Con- 
sidere la rcspuesta que dio una persona depri- 
mida ante la Ldmina 3VH:* 

Parece como... no sd si es una chica o un chi- 
oo. Podria ser cualqulera. Creo qua no Importa. 
Esta persona esta muy agotada lisicamente. Creo 
que es una ella. Esta simplemente cansada. No 
ha quedado traumatizada ni nada. S6lo esta sen- 
lada a la mesa con sus amigos y se siente real- 
mente cansada. No esta en nlngim peligro de 
salud o nada. Estas son sus llaves. Sus amigos 
la llevan arrastrando hasta su habitacidn y la 
meten en cama. Al dia siguiente esta bien. No 
queda traumatizada. Esta cansada a nivel fisico, 
no mental (Ryan, 1987). 

Lo que dcstaca cn la respuesta cs la negacidn 
repctida del peligro o el Trauma. Pero despuds 
durante la prueba ya no se sostiene la ncgacidn 
de dste. Vdasc c6mo respondid csta persona a 
la Idmina en bianco, cuando rclatd una historia 


• La lamina 13VH represenia a una persona —quc 
puede scr vardn o mujer— arrodillada o tirada a un 
ladodc un sofa con la cabcza inclinada sobre un brazo. 
En una esquina se encucnlra un objeto dibujado dc 
mancru vaga quc algunos indi viduos examinados intcr- 
pretan como un revdlvcr o alguna otra arma. 


acerca de un joven, traumatizado en la escuela, 
que lleva su automdvil junto al rfo: 

Ve el puente, se siente realmente Iriste. Recuer- 
da que ha escuchado historias sobre gente que 
salta y se mata. Nunca pudo comprender por qu4 
lo hicieron. Ahora comprende, salta y se mata... 
deberia ha bar esperado porque las cosas stem- 
pre so ponen bien a veces. Pero no esparo, se 
murid (Ryan, 1987). 

La mayorfa de los clfnicos concluirfa quc la 
persona que produjo estas historias ha sido trau¬ 
matizado y se defiende contra sus impulsos 
autodestructivos. De manera corrcspondienlc, 
el clfnico harfa bien en explorer estas cucstio- 
nes cn psicoterapia. 

Es diffcil valorar la idoneidad psicomdtrica 
del TAT debido a la abundancia de mdtodos de 
calificacidn e intcrprctacidn. Los clfnicas defien- 
den la pmeba sobre bases anccddticas, scfialan- 
do las conclusiones notables y confirmatorias 
como la que se ilustra antes. No obstante, los 
investigadorcs quc se inclinan hacia los datos se 
muestran m4s cautos. Un problema es que los 
protocolos del TAT quc sc califican de manera 
formal poscen una conftabilidad test-retest muy 
baja, con un valor mediano de r = .28 (Winter y 
Stewart, 1977). Lo quc es m4s, 82% de los usua- 
rios dc la prueba cmplcan procedimientos “per 
sonalizados" pare interpretar cl TAT y otras 
pruebas proyectivas (Wade y Baker, 1977). 
Entonces, la intcrprctacidn del TAT sc basa en 
gran medida cn estrategias con una conftabili- 
dad y validez desconocidas y no sometidas a 
prueba. En respuesta a estas preocupacioncs, 
varios investigadorcs han disehado nuevos enfo- 
ques de calificacidn de la prueba que muestran 
esperanza de proporcionar una fundamentacidn 
psicometrica sdlida para este instrumento 
(McGrcw y Teglasi, 1990; Ronan, Colavito y 
Hammondtree, 1993). Sin embargo, es dc sor- 
prender cl poco avancc cn la investigacidn acer¬ 
ca dc los sistemas de calificacidn del TAT. 

PRUEBA DE LAMINAS PROYECTIVAS 

La Picture Projective Test , PPT (Prueba de le¬ 
mmas proyectivas), es un intento largamente 
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esperado de construir un instrumento con pro- 
pdsitos generates que tuviera cualidades psico- 
n^iricas mejoradas (Ritzier, Sharkey y Chudy, 
1980; Sharkey y Ritzier, 1985). Los autores de 
esta prueba senalan que la mayor parte de las 
Idminas del TAT cjcrcen un fuerte estfmulo 
negalivo como medios de "extraccidn” en la 
nanacidn de historias. Dichas laminas sc pre- 
sentan en tonos oscuros, sombreados, y la ma¬ 
yor parte de las escenas representan personas 
en situacioncs poco claras o sombrfas. Por tan- 
to. no es de sorprender que las rcspucstas pro- 
yectivas dadas a esta prueba sc canaliccn en 
gran medida hacia historias negativas y mclan- 
cdlicas (Goldfried y Zax, 1965). 

En contrastc, la PPT utiliza un nuevo con- 
junto de laminas tomadas del ensayo fotogrdfi- 
co llamado Family of Man que publicdcl Museo 
dc Arte Moderno (1955). Para la seleccidn de 
Ins 30 fotograffas se utilizaron los siguientes 
criterios: 

• Las ilustracioncs tenfan que mostrar la posi- 
bilidad de producir material proyectivo sig- 
nificadvo. 

• La mayor parte, pero no todas las Idminas, 
tenfan que incluir mas de un personaje hu- 
mano. 

• Cerca de la mitad dc dstas tenfan que repre- 
sentar a seres humanos que mostraran la ex- 
presion de afectos positivos (p. ej., sonrefr, 
abrazarse, bailar). 

• Cerca dc la mitad dc las fotograffas tenfan 
que representar seres humanos en poses acti- 
vas, no simplcmente parados, sentados o acos- 
tados. 

En el piloteo inicial, los autores compararon las 
producciones de historias para cl TAT y la PPT 
de ocho estudiantes de pregrado en diversas 
variables como extensidn de las historias, tono 
cmocional y nivel dcaclividad (Ritzier, Sharkey 
y Chudy, 1980). En comparacidn con las pro¬ 
ducciones para el TAT, las historias de la PPT 
fueron de extensidn paralela, pero fueron mu- 
cho mas positivas en cuanto a contcnido terrui- 
tico y tono emocional. Tambidn fueron mucho 
mis activas, lo cual significa que el personaje 


central tenfa un efecto activo, autodeterminado, 
sobre la situacion en la historia. Ademis, las 
historias dc la PPT colocaban mayor dnfasis en 
los lemas interpersonales que en los intraperso- 
nalcs. En otras palabras, las historias dc la PPT 
daban mayor importancia a los aspcctos "sa- 
nos”, adaptativos, de la personalidad que las 
producciones para el TAT. 

Los autores de la PPT tambidn compara¬ 
ron su instrumento con el TAT en un estudio 
sobre validcz diagndstica (Sharkey y Ritzier, 
1985). Se compararon las producciones dc his¬ 
torias para la PPT y el TAT de 50 individuos; 
normales, depresivos ambulatorios, depresivos 
hospitalizados, psicdticos hospitalizados con 
buenos antecedcntcs premdrbidos y psicdticos 
hospitalizados con antecedentes premdrbidos 
negativos (10 personas en cada grupo). Aun- 
que el TAT y la PPT tuvieron en esencia igual 
capacidad para discriminarcntrc individuos nor¬ 
males y depresivos, la PPT fuc superior en di- 
fcrenciar a personas psicdticas de aqudllas 
normales y depresivas. En la prueba, los indi¬ 
viduos depresivos narraron historias con un tono 
emocional m£s sombrfo y aquellos con psicosis 
rcalizaron mayor cantidad de distorsiones per- 
ceptuales y desviaciones tcmdticas/interpreta- 
tivas. La PPT parece ser un instrumento muy 
prometedor, aunque es obvio que se requiere 
mds investigacidn sobre sus cualidades psico- 
mdtricas. Un aspecto que es digno dc menci6n 
es que cualquier persona puedc comprar los es- 
tfmulos de la PPT en una librerfa local. Los 
materiales requeridos sc encuentran en la co- 
leccidn fotografica Family of Man (Museo dc 
Arte Modemo, 1955). 

TEST DE APERCEPC16N INFANTIL 

Discnado como una extensidn directa del TAT, 
el Test de Apercepcidn Infantil (CAT) consiste 
en 10 liiminas y es adecuado para nihos de 3 a 
10 ados dc edad. La versidn preferida para ni- 
nos pequenos (CAT-A) representa animates en 
ambienles sociales indudablemente humanos 
(Beliak y Beliak, 1991). Los autores de la prue¬ 
ba utilizaron dibujos de animates bajo la supo- 
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sici6n de quc los nirtos pequeiios sc identifica- 
rian mejor con <Sstos que con seres humanos. 
Sc encuentra dispomblc una versidn con figu- 
ras humanas (CAT-H) para nifios de mayor edad 
(Beliak y Beliak. 1994). No existe un sistema 
formal de califtcacidn para el CAT y no sc pro- 
porciona informacion estadfstica sobre confiabi- 
lidad o validez. En vcz dc cllo, el examinador 
prepara un diagntistico o descripcidn de la per¬ 
sonal idad con base en una sfntcsis dc 10 varia¬ 
bles registradas para cada historia: 1) tema 
principal; 2) hdroe principal; 3) principals ne- 
ccsidadcs e impulsos del h£roe; 4) conccpto del 
ambiente (o mundo); 5) percepcidn dc las figu- 
ras parentales, contempordncos y personas mds 
jdvenes; 6) confliclos; 7) ansiedades; 8) defen¬ 
ses; 9) idoneidad del superyd y 10) integracidn 
del yo (incluyendo originalidad de la historia y 
naturaleza del descnlace) (Beliak, 1992). La falta 
de atencidn a las cuestioncs psicometricas en 
cuanto a calificacidn, confiabilidad y validez del 
CAT es perturbadora para la mayorfa dc los cs- 
pecialistas en pruebas. 

OTRAS VARIACIONES SOBRE EL TAT 

El TAT ha inspirado varias pruebas similares di- 
rigidas a ninos y adultos mayores (cuadro 13-7). 
Adcmds, se han desarrollado modificaciones y 
variacioncs de la prueba para minorias dtnicas, 
raciales y lingUfsticas. Una dc las primeras fue 
el TAT de Thompson (T-TAT) en la que se vol- 
vieron a dibujar 21 Idminas originates del TAT 
con figuras afroestadounidenses (Thompson, 
1949). Esta modificacidn para el TAT incor- 
por<5 ciertos cambios no intencionales —por 
cjemplo, en expresiones faciales y en las situa- 
ciones representadas. Como resultado, la T-TAT 
deberfa considerarse una prueba nueva y no s6lo 
una traduce idn del TAT adecuada para perso¬ 
nas afroestadounidenses (Aiken, 1989). 

Otra prueba cspecializada similar al TAT 
es la TEMAS. que consiste de 23 laminas 
cromaticas que representan personas dc origen 
hispano en interaccidn cn ambientes urbanos 
contempordncos (Aiken, 1989; Constantino, 
Malgady y Roger. 1988). TEMAS tienc el sig- 


Cuadro 13-7. Pruebas de Apercepcidn 
Tematica para Poblaciones Especificas 

Adolescent Apperception Cards (Ldminas do 
a percepcidn para adolescentes) 

Esta es la unica prueba de apercepcion lemdtica 
disenada especflicamenle para adolescentes (12 
a 19 ahos de edad). Las 11 Idminas representan 
cuesliones contempordneas relacionadas con los 
adolescentes; los temas Induyen soledad, estilos 
parentales, vlolencia intrafamiliar, actividad en 
bandas delictivas y abuso de drogas (Silvedon, 
1993). Los problemas con este inslrumento inclu- 
yen los temas negativos que se representan en 
las Idminas (que impiden asodadones positivas) 
y la ausenda de cualquier tipo de enfoque objetivo 
para la calificacidn. Como ocurre con muchas tec- 
nicas de apercepcidn temdtica, la AAC es en rea¬ 
lidad una herramienta clinica ideogrdfica, no una 
prueba. 

Ldminas Blacky 

Para nifios de cinco afios de edad y mayores, la 
prueba de las Ldminas Blacky tambidn se basa 
en la premisa de que los nifios se identifican con 
mayor fadlidad con los animales que con seres 
humanos. Los 11 esttmulos de caricatura repre¬ 
sentan las aventuras de un perro llamado Blacky 
y su familia (mamd, papd y su hermano Tippy). 
Ademds de requerirse una historia para cada Id- 
mina, el examinador tambidn presenta una serie 
de preguntas de opddn multiple basadas en las 
etapas del desarrollo psicosexual derivadas de la 
teorfa psicoanalltica (Blum, 1950). Aunque la prue¬ 
ba se desarrolld en un principio con adultos, los 
nifios disfrutan de tomar a Blacky y responden 
bastante bien a las Idminas. Algunos problemas 
con esta prueba incluyen la ausencia de normas, 
en especial para nifios. y la baja estabilidad de 
las puntuadones (LaVoie, 1987). 

Prueba Pictdrica Michigan-Revlsada 

Para nifios entre 8 y 14 aiios de edad, la MPT-R 
consiste de 15 ilustraciones y una Idmina en bian¬ 
co. Las respuestas se califican en cuanto al Indice 
de tensidn (p. ej., representacidn de idoneidad 
personal), Direccidn de la fuerza (el que la (igura 
central actue o reciba los efectos de una acckJn 
sobre ella) y Tiempo verbal (p. ej., pasado. presen- 
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Cuadro 13-7. Pruebas de Apercepcidn 
Tematica para Poblaciones Especfficas 
(continuacion) 


te. futuro). Estas tres calificaciones se pueden 
combinar para producir un Indice de desadapta- 
ci6n. La confiabilidad y las normas son adecuadas, 
aunque la evidencia de su validez es insatisfacto- 
ria. Uno de los principales problemas con esta 
prueba es que las Idminas presentan las relacio- 
nes interpersonales de manera tan vfvida que 
literalmente se le deja poco a la imaginacidn del 
nino (Aiken, 1989). 

Prueba de Apercepcidn para Edades Avan- 
zadas (SAT) 

Aunque las 16 sltuaclones representadas en las 
laminas de la SAT incluyen algunas circunstanclas 
posilivas, la mayoria de las ilustraciones se dlse- 
fiaron para reflejar temas de desamparo, abando- 
no, dlscapacidad, problemas (amiliares, soledad, 
dependencia y baja autoestima (Beliak, 1992). Los 
crlticos se quejan de que la SAT estereotipa a 
los ancianos y, portanto, desalienta las respuestas 
activas (Schaie, 1978; Klopfer y Taulbee, 1976). 


nificado de "lema" cn espanol y al mismo tiem- 
po represcnta las siglas en inglds para “tell me 
a story" (cudntamc una historia). El contcnido 
temdtico de las historias para la TEMAS se cali- 
fica en cuanto a 18 funciones cognitivas, nueve 
de personalidad (yoicas) y sicte afectivas. La 
prueba tambidn puede calificarse cn relacidn 
con varios Indices objetivos como tiempo de 
rcaccidn, fluidez, preguntas no respondidas y 
transformaciones del estfmulo (p. cj., una carta 
se transforma en una bomba). Los nifios de ori- 
gen hispano responden bien a la TEMAS, aun¬ 
que puedan mostrarse incapaces de expresarse 
ante las pruebas proyectivas tradicionalcs. 

La confiabilidad inconsistente de la TE¬ 
MAS es una fuente de gran preocupacidn, dado 
que la confiabilidad limila la validez. El manual 
informa que los resultados del coeficiente alfa 
de Cronbach para las 34 funciones de califica- 
ci6n fueron de .31 a .98, con la mitad por de- 
bajo de .70. Las confiabilidades test-retest 
fueron incluso mas bajas; la correlacidn mis 


elevada fue de r =. 53 y para 26 de las 34 fun¬ 
ciones las correlaciones jfueron casi cercanas 
a cero! A pesar de la cuestionable confiabilidad 
del instrumento, varios estudios proporcionan 
sustentacidn para su validez concurrente y 
prcdictiva. Porejemplo, en una muestra clfnica 
de 210 nifios puertorriqueiios, las calificaciones 
esc al ares de la TEMAS predijeron de manera 
razonablemcntc adccuada crilerios independien- 
tes de desarrollo del yo, ansiedad rasgo y con- 
ducta adaptativa, con correlaciones entre .27 y 
.51 (Malgady, Constantino y Rogler, 1984). Un 
flujo constante de invesligacidn ha continuado 
reforzando la utilidad de cstc instrumento, como 
lo revela el examen de Constantino y Malgady 
(1996). Ritzier (1993) proporciona una resefia 
en apoyo para la prueba, mientras que otros 
autores recomiendan que la TEMAS sc utilice 
s6lo con propdsitos de investigacidn. 

TECNICAS EXPRESIVAS 


PRUEBA DEL DIBUJO DE LA HGURA 
HUMANA 

Como recordard el lector, en un capftulo ante¬ 
rior se dijo que Goodenough (1926) utilizd la 
tarea del dibujo de la figura humana como base 
para eslimar la inteligencia. Enseguida, los psi- 
cdlogos con inclinaciones psicodindmicas adap- 
taron el procedimiento para la evaluacidn 
proyectiva de la personalidad. Karen Machover 
(1949, 1951) fue la pioncra cn este nuevo cam- 
po. Su procedimiento sc lleg6 a conocer como 
la Prueba del Dibujo de la Figura Humana 
(DFH). Este procedimiento disfrutd de popula- 
ridad desde un principio y aun se le utiliza am- 
pliamente como herramienta de evaluaci6n 
clfnica. Watkins, Campbell, Nieberding y 
Hallmark (1995) informaron que los dibujos 
proycctivos como el DFH alcanzan el octavo 
lugar de popularidad entre los clfnicos en EUA. 

El DFH se aplica al prescntarle al exami- 
nando una hoja de papel en bianco y un lipiz 
con borrador; pididndole que “dibuje una per¬ 
sona". Cuando se complcta el dibujo, en gene- 
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ral se pide al individuo que dibuje a otra perso¬ 
na del sexo opuesto a la del primer dibujo. Por 
ultimo, sc Ic pide que “invcntc una historia so- 
bre la persona como si 6\ (o ella) fuera un per- 
sonaje de una novela o de una obra de tcatro" 
(Machover, 1949). 

La intcrprctacibn del DFH procede dc ma- 
ncra completamcnte clfnica-intuitiva, guiada 
por varias hipotcsis tentativas con base psicodi- 
namica (Machover, 1949, 1951). Porejcmplo, 
Machover sostenfa que es probable que las 
personas examinadas proyecten sus impulsos 
aceptablcs sobre la figura del mismo sexo y 
aqudllos inaccptables sobre la del sexo opuesto. 
Tambibn creia que los tamanos relativos de las 
figuras del vardn y de la mujer revelaban indi- 
cios dc la identificacibn sexual del individuo 
evaluado. Varias dc las hipbtesis interpretativas 
de Machover aparccen en el cuadro 13-8. 

Estas premisas interpretativas son pintores- 
cas, intcrcsantes y plausibles. No obstante, sc 


basan por completo en la teorfa psicodinbmica 
y en obscrvacioncs anecdbticas; Machover hizo 
pocos esfuerzos por validar las interpretacio- 
ncs. El apoyo empfrico para sus hipbtesis cs 
entre cscaso y nulo (Swensen, 1957, 1968). En 
favor del DFH debe decirse que la caiidad ge- 
neral de los dibujos predice, aunque dc mancra 
debil, la adaptacibn psicoldgica (Lewinsohn, 
1965; Yama, 1990). Sin embargo, a juzgar por 
las normas contcmporancas para la cvidcncia, las 
evaluaciones radicates y displicentes dc la perso¬ 
nal idad que se obtienen del DFH con lanta 
frecuencia son vergonzosas. Algunos erfticos 
han concluido que el DFH cs una prueba defi- 
ciente que ya no deberia utilizarse (Gresham, 
1993; Motta, Little y Tobin, 1993). 

Mbs que emplear el DFH para inferir los 
malices dc la personal idad, una aplicacibn mis 
apropiada de esta prueba es la deteccibn de 
nifios de quienes se sospecha un trastomo con- 
ductual ocmocional. Para tal propbsito, Naglicri, 


Cuadro 13-8. Interpretaciones iiustrativas de la Prueba del dibujo 
de la figura humana 


Slgno Signiflcado interpretativo hipotetico 


Cabeza grande de manera despropordonada 

Omisibn de rasgos faciales deliberada 

Boca dibujada con una raya gruesa 

Mandfbula cambiada, borrada o reforzada 

Ojos masculinos de gran tamano con pestanas 

Entasis en el cabello; p. ej., una barba 
Entasis grbfico en el cuello 
Tratamiento conspicuo del dedo indice, pulgar 
Indicacibn anatbmica de brganos intemos 


Enfermedad cerebral orgbnica; cirugfa cerebral pre¬ 
via; preocupaciones con dolores de cabeza. 

EvaskSn acerca de relaciones interpersonales muy 
conlliclivas. 

Personalidad verbalmente agresiva, demasiadocrili- 
ca y en ocasiones sadica. 

Compensacion por debilidad, indecisibn y temor a la 
responsabllidad. 

Varbn con inclinaciones homosexuales, con frecuen¬ 
cia muy extravertido. 

Una indicacibn de esfuerzos por la virilidad. 

Perturbacibn por la falta de control sobre los impulsos. 

Preocupacibn por la masturbadbn. 

Se encuentra sblo en la esquizofrenia o en pacienles 
con mania activa. 


Futnl*: Basado en Machover, K (1949) Personality projection in the drawing ot Iho human Dgura Spwtnglield, IL: Charles C Thorta*. 
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McNeish y Bardos (1991) desarrollaron el Di- 
bujo de la figura humana: procedimicnto dc de- 
teccidn para el trastorno emocional (DAP: 
SPED). En un estudio, la prccisidn diagndstica 
dc los ninos con problemas sc mejord de mane- 
ra significaiiva a travds de la aplicacidn del cn- 
foque de calificacidn del DAP:SPED (Naglieri 
y Pfeiffer. 1992). 

TlCNlCA DEL DIBUJO PROYECT1VO 
DE CASA-ARBOL-PERSONA (H-T-P) 

La H-T-P es una prueba proyectiva que utiliza 
dibujos a pulso dc una casa, un drbol y una 
persona (Buck. 1948, 1981). A la persona exa¬ 
minada se le da casi complcta libertad de trazar 
los Ires objelos, se piden dibujos a lipiz y a 
colores por separado. Aunque el examinador 
puede improvisar una prueba H-T-P con meras 
hojas de papel cn bianco. Buck (1981) rcco- 
mienda el uso de una forma de dibujo con cua- 
tro hojas que dene en la primera pagina la 
informacidn de identificacidn. Las paginas 2,3 
y 4 denen como tftulo Casa. Arbol y Persona. 
Se necesitan dos formatos de dibujo para cada 
examinando, uno para los dibujos a lapiz y el 
otro para los dibujos a color. Buck (1981) tam- 
bidn proporciona un formato independiente de 
cuatro hojas para una fase dc interrogatorio pos¬ 
terior a los dibujos que consistc de 60 pregun- 
tas disenadas para obtener las opiniones de la 
persona examinada cn cuanto a los elementos 
de los dibujos. Muchos profesionales considc- 
ran que la fase de interrogatorio no amerita un 
esfuerzo adicional. Tambidn se cucstiona el 
valor de los dibujos rcalizados con colores 
(Killian. 1987). 

La Tdcnica Proyectiva del Dibujo de casa- 
Srbol-persona tiene en mucho la misma herencia 
que la Prueba del Dibujo de la Figura Humana. 
Como la Prueba DFH, la H-T-P se concibid en 
un principio como una medida de intcligencia, 
completa con un sistema de calificacidn cuan- 
titati va para estimar un nivel aproximado dc ca- 
pacidad (Buck, 1948). Sin embargo, los clfnicos 
pronto abandonaron el empleo de la H-T-P como 
medida dc intcligencia y ahora se le utiliza 


casi de manera exclusiva como medida pro¬ 
yectiva de la personalidad. 

Aunque no se ahondari cn los dctallcs, la 
intcrprelacidn de la H-T-P dependc de Ires supo- 
sicioncs gcncralcs: el dibujo de la Casa rcflcja 
la vida hogarena y las relaciones intrafamiliares 
de la persona examinada, cl del Arbol refleja la 
manera en que el individuo experimenta el 
ambiente y el de la Persona hace eco de sus re¬ 
laciones interpersonales. Buck (1981) propor¬ 
ciona numerosas hipdtcsis interpretati vas tanto 
para los aspectos cuantitativos como cualita- 
livos de los tres dibujos. 

La H-T-P es una atracliva prueba que ha 
fascinado a los clfnicos por mis dc 40 afios. 
Por dcsgracia. Buck (1948, 1981) nunca ha 
proporcionado algun tipo de evidencia que sus- 
tente la confiabilidad o validez de este instru¬ 
ment. De hecho, quizas 61 mismo es su peor 
crftico. En cierto punto dentro de su manual de 
la prueba, incluso llega a afirmar que la inves- 
ligacidn sobre validacidn no es posible con la 
H-T-P (Buck, 1981, p. 164). Enlre los impedi¬ 
ments para dicha in vestigacidn cita los siguicn- 
tes elementos: 

1. Ningun signo en sf mismo es indicacidn in- 
falible de alguna fortaleza o debilidad en cl 
individuo. 

2. Ningun signo cn la H-T-P tiene un solo sig- 
nificado. 

3. La importancia dc un signo puede diferir 
notablemente dc una constelaci6n a otra. 

4. La cantidad de datos diagndsticos y pronds- 
ticos que pueden obtenerse dc cada uno de 
los puntos de anilisis puede variar en gran 
medida de una persona a otra. 

5. Los colores no tienen algun significado ab- 
soluto y universal. 

6. Ninguno de los elementos del sistema de ca- 
lificacidn cuantitativa puede tomarse auto- 
miticamente por su valor aparente (Buck, 
1981). 

En general, los intentos por validar la H-T-P 
como medida de personalidad han lallado (para 
una revisidn vdase Ellis, 1970; Hayworth, 1970; 
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Krugman, 1970; Killian. l987).Crfticosescru- 
pulosos han recomendado en forma repetida 
que se abandone el uso de la H-T-P y enfoqucs 
similares dc dibujo de figuras para la evalua- 
cidn de la personalidad. Pero cstos pronuncia- 
mientos sc han lopado en aparicncia con ofdos 
sordos. La popularidad de la H-T-P y de otras 
tdcnicas proyectivas continua sin disminuir. En 
la seccidn final de este capftulo se ofreccn al- 
gunas refiexiones acerca de la aceptacidn que 
todavfa tienen las tdcnicas proyectivas. 

B REfTERAClbN: LA PARADOJA 
PROYECTIVA 

La cvidcncia es bastante clara en cuanto a que 
las inferencias obtenidas de las pruebas 
proyectivas son, con frecuencia. incorrcctas. 
Ante las conclusiones negativas de validacidn, 
la duradera aceptacidn de los profcsionales 
hacia estas pruebas constituye lo que se ha 11a- 
mado la paradoja proyectiva. ^Cdmo se expli¬ 
ca que instruments cuya evidencia de validez 
es. en cl mcjor de los casos, confusa, con fre¬ 
cuencia marginal, en ocasiones no existente o, 
incluso, decisivamente negativa, continden 
siendo popularcs? 

Se ofrecen dos explicaciones para la para¬ 
doja proyectiva. La primera es que los seres 
humanos se adhicren a estereotipos preexis- 
tentes aunque sc les exponga a rcsultados contra¬ 
dictories. Hacc decenios. Chapman y Chapman 
(1967) demostraron este fen6meno con las 
piuebas proyectivas, llarruindolo validation ilu- 
soria. Estos investigadores le pidieron a estu- 
diantes universitarios que observaran varios 
dibujos dc figuras humanas similares a los ob- 
tenidos en la Prueba del dibujo de la figura hu- 
mana (DFH). Los cstudiantes ignoraban todo 
acerca de las pruebas proyectivas y no cono- 
cfan las hipdtesis interpretativas tradicionales 
para la DFH. Cada dibujo se acompanaba de 
descripciones breves de dos sfntomas que su- 
puestamente caracterizaban al paciente que ha¬ 
bfa rcalizado los dibujos. En realidad, dstos se 
asignaron de manera aleatoria a los dibujos y 


consistfan de trozos de tradicidn clfnica asocia- 
da con la DFH que se habfa obtenido dc un 
cuestionario que se habfa enviado antes por co» 
rreo a varios psicdlogos clfnicos. Por cjcmplo, 
dos de los sfntomas utilizados eran: 

1. Estd preocupado con su hombrfa. 

2. Sospecha de otras personas. 

Cada estudiante recibid una combinacidn dife- 
rente de dibujos y se les asignaron los sfntomas 
de manera aleatoria. 

Despuds se les pidi6 que demostraran aque- 
llo que habfan descubierto al describir, para 
varios dibujos, los sfntomas que habfan obser- 
vado que se vinculaban con cse tipo de dibujo. 
Por supuesto, en realidad no habfa nada que 
descubrir, dado que sfntomas y dibujos se com- 
binaron aleatoriamente. No obstante, los par- 
ticipantes respondieron en tdrminos de los 
estereotipos clfnicos populares (p. ej., ojos poco 
comunes indican suspicacia, cabcza grande 
sugicre preocupacidn por la inteligencia). En 
apariencia, los estereotipos de sentido comun 
que lenfan los participantes surgicron fuertes 
y sin ningun dano —a pesar de la abundan- 
cia dc ejemplos que no los confirmaban. Qui¬ 
zes algo similar ocurre en todos los campos 
de las pruebas proyectivas: los clfnicos obscr- 
van los casos confirmatorios, pero ignoran las 
conclusiones mds numcrosas que contradicen 
sus expectativas. 

La segunda explicacidn para la paradoja 
proyectiva es que muchos clfnicos no utilizan 
de ninguna manera los mdtodos proyectivos 
como pruebas, sino como enfoques auxiliares 
para le entrevista clfnica. £stos emplean las tdc- 
nicas proyectivas como herramientas clfnicas 
para oblcncr hipdtesis tentalivas acerca dc la 
persona evaluada. La mayor parte de estas hi- 
pdtesis rcsultaran falsas cuando se les examine 
de manera mds cercana. Sin embargo, las po- 
cas que sc confirman pueden tener implica- 
ciones importantes para cl manejo clfnico del 
individuo evaluado. Lo que es mds, se sospe¬ 
cha que estas hipdtesis fruclfferas podrfan no 
surgir—o podrfan hacerlo con mayor lentitud— 
si el profesional se basara por completo en la 
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Ejemplo OE CAS013-1 

PRUEBAS PROYECT1VAS COMO AUXIUARES DE LA ENTREV1STA 


Un ejempio especifico puede ayudar a aclarar ei papel de las tbcnicas proyectivas como auxiliares 
de la entrevista cllnica. Durante la guerra de Vietnam, un psicblogo de la Veteran's Administration 
examind a un joven soldado quo por accidente se habta dlsparado en una pierna con una pistola 
calibre .45, cuando practicaba c6mo desenfundar con rapidez mientras se encontraba en 
la selva. Los cirujanos encontraron necesario amputarte la pierna desde la rodilla. El soldado 
estaba bastante deprlmido y todos supusleron que sufrla del duelo y la culpa por su enorme 
tragedia personal. Hablaba muy poco y se mostraba casi inestable. No obstante, se le persuadkS 
para que realizara una serfe de dlbujos de figuras. En uno de ellos se represent*) a si mis* 
mo como artlllero de un helicdptero, que disparaba balas de manera Indiscriminada a la selva 
debajo de s(. Cuando se le cuestlond sobre esle dibujo, se empezd a comportar de modo muy 
animado y confesd que disfrutaba del combate. Guiado por las poslbles impllcaciones de este 
mdrbido dibujo, el psicblogo bused enterarse mas de las aclitudes del veterano hacia el combale. 
En el curso de varias entrevistas, el veterano reveld que disfrulaba en particular de disparar a 
objetos en movimiento —animates, soldados, civiles— sin Importarle a quidn. De manera gradual 
se hlzo claro que este joven veterano era un criminal de guerra en estado incipiente y que se 
encontraba deprimido debldo a que su lesldn le impedirfa regresar al frente. Sobra decir que 
esta Informacidn tuvo un fuerte impacto sobre ol tono del Informe psicoldgico. 


entrevista o utilizara pruebas formates con 
confiabilidad y validcz cstablcddas (ejempio de 
caso 13-1). No obstante, es diftcil examinar 
empfricamente esta afirmacidn. Sc cstd abierto 


a la posibilidad de que las aplicaciones clf- 
nicamente exitosas de las tdcnicas proyectivas 
proporcionen mayor evidencia de la validacidn 
ilusoria. 


RESUMEN 


1. Las pruebas proyectivas se basan en la hi- 
pdtesis proyectiva: las interpretaciones 
personales de estimulos ambiguos deben re- 
flejar por obligacidn las necesidades, moli- 
vos y conflictos inconscicntcs de la persona 
examinada. Mdtodos proyectivos populares 
incluyen la Prueba de interpretacidn de for¬ 
mas de Rorschach, el Test de apercepci6n 
temdtica, las pruebas de frascs incomptetas 
y las pruebas de dibujo (p. ej„ la Prueba del 
dibujo de la figura humana). 

2. El Rorschach, publicado en 1921, consiste 
de 10 manchas de tinta casi simdtricas. En 
cada una el examinador pregunta ‘V.Quc 
podria ser esto?” En la fase de cncuesta, el 
examinador aclara cudles aspectos de la man¬ 


cha (p. ej., forma o color) representaron 
un papel en la creaciOn de cada respuesta. 

3. El mltodo de calificaciOn del Rorschach 
que prefiere Exner codifica cada respuesta 
en cuanto a localization, forma, movimiento 
humano, utilization del color, contenido y 
otras variables. Las calificaciones de resumen 
y las proporciones de las variables sumi- 
nistran las hipOtcsis sobre el funcionamiento 
de la personalidad. A pesar de que durante 
largo tiempo ha sido popular, lodavfa exis- 
ten dudas al reded or de la prueba Rorschach 
con respecto a su confiabilidad y validez. 

4. La Holtz/nan Inkblot Test incluye 45 14mi- 
nas; se requicre una sola respuesta para cada 
una. Las categorfas de calificaciOn de la HIT 
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son sumamente confiables, con una con¬ 
cordance inlercalificadorcs que por lo ge¬ 
neral se localiza en el rango dc .90. Los 
estudios dc validez cn los que se utilizan 
reglas simples de decisidn sustentan el em- 
pleo dc la HIT como un auxiliar para el 
psicodiagndstico, en especial dc la es- 
quizofrenia. 

5. El Rotter Incomplete Sentences Blank (RIBS) 
conticne 40 partes dc frases escritas en su 
mayor parte en primera persona. Cada fra- 
se completada recibe una calificacidn de 
adaptacidn de 0 (buena) a 6 (deficiente); la 
suma forma la calificacidn total dc ajuste. 
Las tasas de clasificacidn correcta (p. cj., 
adaptation contra dcsadaptacidn) son dc- 
masiado bajas para la toma de decisiones a 
nivel individual. 

6. EJ Rosenzweig Picture Frustration Study 
(Estudio P-F) consistc de 24 dibujos, cada 
uno de los cuales muestra a dos personas 
cn una siluacidn sumamente frustrantc. El 
individuo examinado proporciona la pri¬ 
mera respuesta verbal que Ic viene a la men- 
tc. Las calificacioncs objetivas indican los 
modos tfpicos de rcaccidn ante la frustra- 
cidn. Dcbido a su poca confiabilidad, el 
Estudio P-F cs adccuado primordialmenle 
para la investigacidn. 

7. El Test de apcrccpcidn tematica (TAT) con¬ 
sistc de 30 dibujos y fotograffas cn bianco 
y negro; una de las Idminas estd en bianco. Sc 
pide al examinando que invente una historia 
dramdtica para cada ldmina, incluycndo cl 


pasado, prcsente, futuro y los senlimieruoi 
dc los personajes principales. En general, | a 
interpretation del TAT depende del an$|j s j s 
clfnico-cualitativo de las producciones dc 
historias. 

8. Variaciones del TAT incluyen la Picture 
Projective Test, la cual se basa en fotog ra . 
fias del ensayo fotogrdfico Family of Man ; el 
TAT dc Thompson para afrocstadounidcn- 
ses; el Test dc apercepcidn infantil (CAT).el 
cual utiliza dibujos dc animates; la TEMAS, 
una prueba de apercepcidn dischada para per¬ 
sonas de origen hispano; y la prueba dc aper¬ 
cepcidn para personas de edad avanzada. 

9. En la prueba dc Dibujo de la figura Humana 
(DFH) de Machovcr, simplementc se le pide 
a la persona examinada que "dibuje una 
persona". La interprctacidn se realiza de ma- 
nera clfnica-intuitiva con base en hipdtesis 
publicadas; por ejemplo, rcmarcar el trazo 
de la mandfbula seriala indecisidn. Otro ins- 
trumento que siguc una Ifnea similar cs la 
Tdcnica del dibujo proyeclivo dc Casa-Ar- 
bol-Persona (la persona evaluada dibujaes- 
los objetos), que tiene evidencia de validez 
tambidn muy limitada. 

10. La paradoja proycctiva (la popularidad du- 
radera de las pruebas proyectivas a pesar 
de su cuestionable validez) puede expiicar- 
sc, en parte, por el fendmeno dc la valida- 
cidn ilusoria. feta sc demuestra cuando los 
individuos ignoran los casos que no confir- 
man sus conclusiones y se adhieren a sus 
estcrcotipos preexistentes. 
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La historia de la evaluacidn de la perso¬ 
nalidad puede caractcrizarsc por dos tcndencias 
superpuestas. Primero, las tdcnicas proyectivas 
deseslructuradas, como la prueba Rorschach, 
dominaron las prucbas dc personalidad a inicios 
del siglo XX y despuds perdieron su popularidad. 
En segundo lugar, los enfoques estmeturados 
como los inventarios de autoinforme y las cla- 
sificaciones conducluales obtuvieron importan- 
cia a mediados del siglo y luego aumentaron 
rdpidamente su popularidad. En cl tema ante¬ 


rior, sc introdujo al lector a las muchas varie- 
dadcs dc tdcnicas proyectivas. Estos mdtodos 
son rcsplandecientes en cuanto a las hipdtcsis 
que dan por rcsultado; sin embargo, las tdeni- 
cas proyectivas carecen en gran medida de la 
aprobaci6n de los clfnicos con orientacidn psi- 
comdtrica. Este capftulo sc cnfocard en los 
mdtodos mas objetivos para la evaluacidn de 
la persona que favorecen los psicdlogos con 
una mentalidad dirigida a la medicidn. En el 
tema 14A, Inventarios de autoinforme, se revi- 
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san los insirumentos con respuestas de cierto/ 
falso y de eleccidn forzosa, incluyendo la prue- 
ba de personalidad de m6s amplio uso, el In- 
ventario multifasico de la personalidad (MMFI) 
y su revision mds recicnte, el MMPI-2. En el 
tcma 14B, Evaluacidn conductual y enfoques 
rclacionados, se analizaran los enfoques mis rc- 
cientcs que dependcn de las observaciones y 
clasificaciones conductualcs. 

Los psicdmetras contemporincos han de- 
pendido de Ires taclicas para el desurrollo de 
las pruebas: los enfoques ligados a la teorfa, las 
cstralcgias analftico-factoriales y los mdtodos 
con codificacidn de crilerio. Sc organizard la dis- 
cusidn accrca de los inventarios de autoinformc 
alrededor de estas ires categorfas. Por supues- 
to, las fronteras son un lanlo artificiales y ma¬ 
chos de los autores de pruebas utilizan una 
combinacirin de mdtodos. 

Los enfoques estructurados para el examen 
de la personalidad que sc analizan en las siguien- 
les secciones estdn empapados de los detalles 
de la metodologfa psicomdtrica. Estas pruebas 
presentan referencias notables a los fndices de 
confiabilidad, codificacidn de criterio, andlisis 
factorial, validacidn de constructo y otras for¬ 
mas de conocimicnto tdcnico. Por esta razdn, 
es frecucnte que los enfoques que se analizan 
aquf se consideren objetivos —en contraste con 
los proyectivos. No obstante, el que sc consi¬ 
deren objetivos en cualquier sentido significa¬ 
tive es en realidad una pregunta empfrica que 
debe responderse con base en la investigacidn. 
Quizd sea mds adecuado llamarlos metodos 
estructurados. Lo son en el sentido de que para 
su aplicacidn, calificacidn e interpretation se 
siguen reglas sumamente cspccfficas. De he- 
cho, algunos de los enfoques son tan absoluta- 
mente estructurados que la persona examinada 
puede responder a las preguntas presentadas en 
una pantalla de computadora y observar un in¬ 
forme narrativo generado por esta, el cual se 
emitc por la impresora unos segundos despuds.* 


* Los informes narrativos por computadora pueden no 
ser del todo un desarrollo positivo. En el siguiente 
capitulo se analizan los benefleios y riesgos de los in¬ 
formes gcncrados por computadora. 



INVENTARIOS GUIADOS 
POR LA TEORfA 


La construccidn de varios inventarios de autoin¬ 
forme se ha guiado de manera estrecha por las 
teorfas form ales o informales de la personalidad. 
En estos casos. el autor de la prueba disefid el 
instrumento alrededor de una teorfa preexisten- 
tc. Los inventarios guiados por la teorfa contras- 
tan con los enfoques analftico-factoriales, que 
con frecuencia producen una teorfa retrospec- 
tiva basada en las conclusiones inicialcs de la 
prueba. Estos inventarios tambidn difieren del 
cstricto empirismo atcdrico que se encucntra 
en los insirumentos con codificacidn de crite¬ 
rio como el MMPI y el MMPI-2. Ejemplos de 
inventarios guiados por la teorfa incluyen el 
Edwards Personal Preference Schedule (Invcn- 
tario Edwards de preferences personates; 
EPPS) y la Personality Research Form (Forma 
de investigacidn de la personalidad; PRF), am- 
bos basados en la teorfa de personalidad de 
Murray (1938) sobre necesidades-presioncs. 
Otros ejemplos incluyen cl Inventario Tipold- 
gico de Mycrs-Briggs (MBTI), que representa 
una aplicacidn de la teorfa de Carl Jung sobre 
tipos de personalidad. El Jenkins Activity Survey 
(Examen Jenkins de actividad), disenado 
para evaluar el patrdn conductual de Tipo A 
con propensidn a la cardiopatfa, tambidn tipifica 
un instrumento guiado por la teorfa. Por ulti¬ 
mo, algunos inventarios guiados por la teorfa, 
como el Inventario de ansiedad: cstado-rasgo 
(IDARE), intentan medir componentes muy 
cspccfficas de la personalidad. A continuacidn 
se revisa cn mayor detalle cada una de estas 
pruebas. 


INVENTARIO EDWARDS DE PREFERENCE 
PERSONAL 

El Edwards Personal Preferences Schedule. 
EPPS (Inventario Edwards de Prcfcrencia Per¬ 
sonal), constituyd el primer intento de medir la 
teorfa de Murray (1938) sobre neccsidades 
manifiestas con un inventario cstructurado de 
la personalidad (Edwards, 1959; Helms, 1983). 
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El lector recordara de un analisis anterior que 
Murray postuld 15 nccesidades y desarrolld 
una prueba proyectiva, el Test de apercepcidn 
icmiitica, para detectar dichas nccesidades. 
Edwards, un psicdmetra consumado muy 
conoccdor de los malices dc la tcorfa de la me- 
dicidn, bused desarrollar una prueba objetiva, 
estructurada, para medir esas 15 necesidades 
de manera mds confiable y vdlida. En la figura 
14-1 se listan las 15 necesidades junto con un 
perfil del EPPS. 


El EPPS consiste de 210 pares de afirma- 
cioncs en las que los reactivos de cada una de 
las 15 escalas se equiparan con los de las 14 
restantes. El inventario emplea un formato de 
eleccidn forzosa en el que la persona examina- 
da debe clegir una afirmacidn dc cada par que 
sea la mds representativa a nivel personal. El 
formato de eleccidn forzosa del EPPS es pecu¬ 
liar y resulta inedmodo para la mayorfa de las 
personas sometidas a prueba, debido a que con 
frecuencia los coloca, como dirfa el proverbio. 
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Figura 14-1. Perfil de muestra del Inventario Edwards de preferences personates 

Fuente: Reproducido con autorizacion de Edwards, A. L. (1959). Edwards PersonaI Preference Schedule. Nueva 
York: Psychological Corporation. Copyright© 1954, 1959 de la Psychological Corporation. Reproducido con autori- 
zacidn. Derechos reservados. 
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cntrc la cspada y la pared. Aquf sc presentan 
Ires reactivos similares a los del EPPS; para 
cada uno, la persona debc elegir aquclla afir- 
macidn que sea mis caracterfstica a nivel per¬ 
sonal: 

1. A. Me gusta hablar frentc a un grupo. 

B. Me gusta trabajar para lograr las metas 
elegidas por mf mismo. 

2. A. Me siento triste cuando veo una noticia 

trigica en la telcvisidn. 

B. Me siento nervioso cuando tengo que ha- 
blar frente a un grupo. 

3. A. No me importarfa limpiar 10 galones dc 

jarabe. 

B. No me importarfa escalar un acantilado 
empinado con una cuerda de seguridad. 

^Por qud adoptd Edwards este inedmodo for- 
mato cn su prueba? La rcspucsta tienc que ver 
con el problema de la propensidn a responder 
de maneras socialmente deseables. La scrie dc 
respucstas dc dcscabilidad social es la ten- 
dencia dc las personas examinadas a responder 
a la descabilidad (o indescabilidad) percibida 
en un reactivo de la prueba, en vez de hacerlo 
de manera precisa a su contcnido. Dicho sim- 
plcmcnte, los individuos tienden a refrendar las 
afirmaciones socialmente deseables y a no ha¬ 
cerlo con las socialmente indeseables —sin to- 
mar cn cucnta la veracidad de las ^spuc-stas.* 
La mayorfa dc las personas responderfan cierto 
a una afirmacidn como: “Me gusta ayudar a 
las personas ancianas a cruzar la calle”, debido 
a que el reactivo aprueba un atributo dcscablc a 
nivel social, mientras que responderfan falso 
a una aftrmacidn como: “En ocasiones he teni- 


• Aqu( sc deberfa mcncionar que la prcdisposicidn dc 
rcspucsta dc dcscabilidad social es una tendencia na¬ 
tural huinana que se encuentra en casi toda persona 
examinada. La forma extrema dc csta tendencia es el 
intento conscientc y dclibcrado dc ‘Tingirse bueno" 
cn las pruebas dc pcrsonalidad. Pcro la descabilidad 
social no nccesariamcntc indica un engailo dclibera- 
do dc parte del individuo. Lsta siempre sc halla pre- 
sente cn cicrto grado. incluso cuando la persona e valuada 
adopta una perspectiva dc "buena fc" al realizar la 
pnicba dc pcrsonalidad. 


do fantasfas sobre la muertc de mis padres", 
debido a que el reactivo permite una cualidad 
socialmente indcseable. Pero cn el caso de al- 
gunas personas, la rcspucsta socialmente dc- 
seable no es precisa cn realidad. Dcspu&s de 
todo, muchas personas no disfrutan en verdad 
de ayudar a las demas y la mayoria de los indi¬ 
viduos han tenido fantasfas sobre posibilidadcs 
desagradables. 

La clcgancia del EPPS es que los pares dc 
afirmaciones en cada reactivo se equiparan en 
cuanto a deseabilidad social (Edwards, 1957). 
Debido a que cada aftrmacidn en un par dentro 
del reactivo tienc cl mismo nivel de deseabilidad 
social, el contenido de cada afirmacidn ejercc- 
ri mayor podcr de "cxtraccidn" para determi- 
nar la clecci6n de la persona examinada. Por 
supuesto, Edwards dischd de manera cuidado- 
sa el contenido de las afirmaciones para incor- 
porar las necesidades de Murray. Al haccr que 
todas las comparaciones posibles entre pares 
de afirmaciones cnglobaran las 15 necesidades, 
el EPPS produce una medida dc la fortaleza 
rclativa de cada una de las necesidades dc 
Murray. 

Dado que cada nccesidad se aparea dos 
voces con las otras 14 necesidades, la puntua- 
ci6n natural maxima que es posible en cada es- 
cata es de 2 x 14 o 28. Dicha puntuacidn 
ocurrirfa si la persona examinada eligiera la 
afirmacidn para una necesidad dada como mis 
caracterfstica a nivel personal que todas las otras 
con las que sc 1c aparea. Por supuesto, la me- 
nor puntuacidn posible en una escala de nece¬ 
sidad serfa dc cero. El EPPS tambiin incorpora 
una vcrificacidn de la consistencia al repetir 15 
reactivos en un formato idcntico. 

El lector reconoceri que el EPPS es una 
prueba ipsativa. En una medida ipsativa, la 
califtcacidn total —promediada entre todas las 
subpruebas— es siempre la misma para todos 
los individuos examinados. Por ejemplo, debi¬ 
do a que el EPPS es una medida ipsativa, la 
puntuacidn escalar promedio total es siempre 
14, y las puntuaciones escalares alias deben 
contrabalancearse con las bajas. Tambi6n debe 
recordarse que, en una escala ipsativa, las pun¬ 
tuaciones altas son relativas, no absolutas. En 
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otras palabras, la fortaleza de cada necesidad 
no se expresa de manera absoluta sino relativa 
a In de otra necesidad de la persona examina- 
da. Por tanto, produce confusidn cl hecho de 
que Edwards (1959) tambidn recomcndara 
presentar las calificaciones del EPPS en un for- 
maio normativo. El manual proporciona pun- 
tuaciones T y percentiles mediante los cuales 
pueden compararse las puntuaciones natura- 
|es de un individuo con los rcsultados de mucs- 
tras universitarias y de adultos en general 
(vdase figura 14-1). Al combinar dos meto- 
dologfas incompatibles (ipsativa y normativa) 
en el mismo instrumento, Edwards hace que la 
interprctacidn de su prueba sea confusa. 

El EPPS se utiliza ampliamente en la orien- 
tacidn universitaria como medio de descubri- 
miento personal y recibe un empleo ocasional 
como herramienta de invcstigacidn. No obstan¬ 
te, algunos criticos considcran al EPPS como 
un ejercicio en construccidn de pruebas mis que 
como un artfculo serio en el mcrcado de las 
pruebas validadas(Heilbrun, 1972; Drummond, 
1987). Muchos clientcs sc frustran y aburren 
cuando realizan la prueba. Lo que cs mis, la 
estandarizacidn es anticuada y los datos de 
confiabilidad no son particularmente emocio- 
nantes. Porcjemplo, la confiabilidad test-retest 
de las 15 puntuaciones escalares va de .55 a 
.87, con una mediana de .73. Cooper (1990) 
concluyd que las normas presentadas en cl tra- 
bajo de Edwards (1959) no corresponden a es- 
tudios normativos mis recientes. 

Los primeros intentos de validar el EPPS a 
travis de calificaciones comparativas de la for¬ 
taleza de las necesidades de Murray con pun¬ 
tuaciones en cl EPPS tuvicron rcsultados mixtos 
(Drummond, 1987). Sin embargo, un cstudio 
recicntc de Piedmont, McCrae y Costa (1992) 
proporciona fuerte apoyo a la validez del EPPS. 
Estos investigadores correlacionaron las califi¬ 
caciones en cl EPPS con aquillas cn cl Inven- 
tario NEO de personalidad (NEO PI) para 330 
personas en estudios de pregrado. El NEO PI, 
que se analiza despues, mide cinco constructos: 
Neuroticismo, Extravcrsidn, Apertura a la ex- 
periencia, Conformidad y Escrupulosidad. El 
patr6n de relaciones sustentd la validez con- 


vergente de ambos instrumentos, con escalas 
que mucstran correlacioncs apropiadas y con- 
firmatorias de la teorfa. Por ejemplo, Agrcsidn 
en el EPPS se correlaciond en .47 con Neuroti¬ 
cismo del NEO PI y en -.53 con Conformidad 
del NEO PI. Las relaciones fucron mis fuertes 
y con mayor confirmacidn de la teorfa cuando 
el EPPS se calificd de manera normativa. El 
formato ipsati vo, dc clcccidn forzosa, del EPPS 
aparentemente disminuyd los coeficientes de 
validez y la validez convergente y de discrimi- 
nacidn. 


FORMA DE INVESDGAa6N DE LA 
PERSONALIDAD 

Otra prueba basada en el sistema de necesida¬ 
des dc Murray es la Personality Research Form, 
PRF (Forma de Investigacidn de la Personali¬ 
dad; Jackson, 1970, 1984b). 6sta se encuentra 
disponible en varias formas que difieren en cl 
numero de escalas o de reactivos por escala. 
Ademis de las pruebas cortas paralclas (for¬ 
mas A y B), la PRF tambidn puede obtenerse 
como formas largas paralclas (formas AA y 
BB). fLstas, las cuales se utilizan principalmen- 
te con estudiantes universitarios, consisten de 
440 reactivos de cierto/falso. Las formas lar¬ 
gas produccn 20 calificaciones escalares dc per- 
sonalidad y dos dc validez, Infrccucncia y 
Dcscabilidad (cuadro 14-1). La versidn mis 
popular de la PRF cs la forma E, que consiste 
de las 22 escalas en una prueba modificada con 
352 reactivos. 

Para construir las formas largas de la PRF, 
Jackson desarroll6 primero descripciones pre- 
cisas y dctalladas de los constructos a medir. A 
continuacidn, se escribieron mis de 100 rcac- 
tivos para cada escala a fin dc dctcctar los rasgos 
subyacentcs a las necesidades hipotdticas. Des- 
puds de la revisidn editorial, estos reactivos se 
aplicaron a grandes muestras de estudiantes uni¬ 
versitarios. Con base en correlacioncs biseria- 
les elevadas con las calificaciones totales de 
escala y la poca correlacidn con las calificacio¬ 
nes de otras escalas y de la de Deseabilidad, se 
seleccionaron 20 reactivos para cada una. 
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Cuadro 14-1. Escalas de la Forma de investigation 
de la Personalidad 

Escala 


Interpretation de la calincaclOn elevada 

Degradation 


Modesto, humilde, acepta la culpa 

Logro 


Lucha por obtener las metas. competitive 

Afiliacidn 


Amistoso, aceptante, sociable 

AgresiOn 


Discute, es combativo, se molesta con facilidad 

Autonomla 


Independencia, evita las restrictiones 

Cambio 


Evita la rutina, busca el cambio 

Estructura cognitiva 


Prefiere la certidumbre, le desag rada la ambiguedad 

Defensa 


EstO en guardia, se ofende con facilidad 

Dominio 


Influyente, disfruta del liderazgo 

Resistencia 


Perseverante, trabajador eslorzado 

Exhibition 


DramOtico, dislruta la atenciOn 

EvitaciOn del dafio 


Evita riesgos y emociones 

Impulsividad 


Impulsivo, se expresa con libertad 

ProtecciOn 


Sollcito, comprensivo, brinda consuelo 

Orden 


Organizado, le desagrada la confusiOn 

Juego 


JuguetOn, despreocupado, dislruta de las bromas 

Sensibilidad 


Se percata y recuerda las sensaciones 

Reconocimiento social 

Se preocupa por la reputation y aprobaciOn 

Socorro 


Inseguro, busca que lo tranquilicen 

ComprensiOn 


Valora el pensamiento lOgico 

Deseabilidad 


Escala de validez; presentation favorable 

Inlrecuencia 


Escala de validez; respuestas poco (recuentes 


A difcrencia de muchos otros invcntarios 
de pcrsonalidad, las escalas PRF no tienen su- 
perposicidn dc reactivos. Como resultado, las 
escalas tienen una independence exceptional*, 
con la mayor parte de los coeficientes dc inter- 
correlaciOn cn las cercanfas dc ± .30 (Gynther 
y Gynther, 1976). Ademls, los rfgidos proccdi- 
mientos de construction de escala que empleO 
Jackson (1970) produjeron escalas con una con¬ 
sistence interna excepcionalmente buena, con 
un rango de .80 a .94 y mediana dc .92. Un 
aspecto deseable de la PRF es su legibilidad: la 
prueba requiere s6lo un nivel de lectura dc quin- 
to o sexto grados (Reddon y Jackson, 1989). 


MacLennan (1992) ha preparado una bibliografTa 
comentada para la PRF con mis dc 375 citas. 

La validez de constructo de la PRF depen- 
de en especial de anOlisis factoriales confirma- 
torios que corroboran la agrupaciOn de los 
reactivos cn 20 escalas (Jackson. 1970,1984b). 
Adcmds, la investigation indica correlaciones 
positives con escalas comparables sobre otros 
inventarios (Mungas, Trontcl y Weingardner, 
1981). Por ejemplo, Edwards y Abbott (1973) 
encontraron correlaciones excepcionalmente 
fuertes y confirmatorias entre escalas similares 
cn la PRF y el Edwards Personality Inventory 
(Inventario dc personalidad Edwards; EPI); 
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(Edwards, 1967). El EP1 es una prucba rcspe- 
tada pero que se utiliza pocas veces y que con- 
siste de 1 200 (!) preguntas de cierto/falso. A 
continuacidn se presentan algunas de las corrc- 
laciones confirmatorias entre las escalas de la 
PRF y del EPI para 218 esiudiantes universita- 
rios dc ambos sexos: 

Rendimicnto (PRF) x Es un trabajador csfor- 
zado (EPI). .74 

Cambio (PRF) x Le agrada una rutina es tabic - 
cida (EPI). -.54 

Proteccidn (PRF) x Ayuda a otros (EPI). .64 
Socorro (PRF) x Dependiente (EPI). .73 

Dcbido a que cstos instrumentos se desarrolla- 
ron de manera indcpcndicntc, segun diferentes 
filosoffas de construccidn de pruebas, los da- 
tos refuerzan la validez de ambas pruebas. 

INVENTARIO T1POL6GICO 
DE MYERS-BRIGGS (MBT1) 

Publicada originalmcntc en 1962, cl MBTI es 
un inventario de autoinforme, dc eleccidn for- 
zosa, que intenta clasificar a las personas se¬ 
gun una adaptacidn de la tcorfa de tipos de 
personalidad de Carl Jung (Myers y McCaullcy, 
1985; Tzeng, Ware y Chen. 1989). El instru- 
mento se presenta en una versi6n con 166 reac- 
tivos (Forma F) y una versidn con 126 reactivos 
(Forma G). Aquf sc analiza principalmente la 
Forma F debido a que es la que mils se utiliza. 
De hecho, es posible que el MBTI sea la pruc¬ 
ba de personalidad que mis se utiliza con po- 
blaciones psiquiitricas (DeVito, 1985). 

El MBTI secalifica en cuatro dimensiones 
tedricamente independientes: Extravcrsidn-In- 
troversidn, Sensaci6n-Intuici6n, Pensamiento- 
Sentimiento, Juicio-Perccpci6n. Aunquc las 
calificacioncs en cada dimensidn bipolar son 
continuas, es prictica comun que las dc una per¬ 
sona examinada se resuman dc manera tipold- 
gica. Por ejemplo, un individuo podrfa obtener 
calificaciones mis inclinadas hacia la Extraver- 
sidn, Intuicidn. Sentimiento y Percepcidn y, por 


lanto, obtener un tipo resumido de ENSP* Di- 
cho perfil sugerirfa las siguientes caracterfsti- 
cas de personalidad; una mayor relacidn con cl 
mundo exterior de las personas y cosas que con 
el mundo interior de las ideas (E); una tenden- 
cia a buscar las posibilidadcs en vez de trabajar 
con hechos conocidos (N); una inclinacidn a 
basar los juicios en valores personates mis que 
en el analisis y la Idgica (S) y una preferencia 
por un modo dc vida flexible y espontineo mis 
que por una existencia ordenada y planeada (P). 

Los datos dc cstandarizacidn del MBTI 
consisten de normas percentiles para las califi¬ 
caciones dc los cuatro indicadores, derivadas 
de pcquefias muestras de estudiantes de prepa¬ 
ratory y universidad. Las confiabilidadcs por 
mitades para las cuatro escalas se encuenlran 
en los rangos de .70 y .80. Quizis en parte de¬ 
bido a que los estudios en apoyo de su validez 
son escasos, la intcrprctacidn tipoldgica del 
MBTI no ha sido bien recibida en tdrminos ge¬ 
nerates por los psicdlogos orientados a la me- 
dicidn. Un problcma con este enfoque es que 
la interpretacidn parece demasiado superficial 
y scncilla y posee una calidad tipo hor6scopo. 
En justicia con el MBTI, existen maneras mis 
claboradas de interpretar cl instrumento, como 
lo revela la explosidn de investigacidn recien- 
te. Kaufman, McClean y Lincoln (1996) listan 
references rclacionadas. 

MEDIDAS DE LA CONDUCTA TIPO A 

Se encuentran disponibles varias medidas tipo 
cucstionario dc la conducta Tipo A, creadas con 
propdsitos de investigacidn. La mis recientc es 
la Time Urgency and Perpetual Activation', 
TUPA (Escala de Premura y Actividad Conti- 
nua; Wright, McCurdy y Rogoll, 1992). La es¬ 
cala TUPA es respetada por investigadores en 
medicina conductual debido a su excelencia 
psicomdtrica. No obstante, el instrumento mis 
conocido y mis utilizado de este tipo es el Exa- 
men Jenkins de actividad. 


* Dado a que existen dos polos para cada una de las 
cuatro dimensiones, cl ntimero dc posibles tipos de 
personalidad es 2*. que es 16. 
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La Jenkins Activity Survey, JAS (Gncuesta 
Jenkins de Actividad), es un cuestionario dc 
autoinforme con 52 reactivos de opcidn multiple 
discfiados para idenlificarel patron conductual 
Tipo A, con propensidn a la cardiopatfa, quc sc 
analizd en el capftulo anterior (Jenkins, 
Zyzanski y Rosenman, 1979). Los reactivos cn 
la JAS se parcccn a los siguientes: 

En la actualidad, usted considcra quc es: 

A. /.Definiti vamenlc compcliti vo y ambicio- 
so? 

B. ^Probablemente competitivo y ambicioso? 

C. ^Probablemcnte rods relajado y dcspreo- 
cupado? 

D. ^Definitivamente mds relajado y despre- 
ocupado? 

Adcmds de la puntuacidn mixta de la conducta 
Tipo A, la JAS produce trcs subcscalas deriva- 
das dc mancra analftico-factorial: Vclocidad e 
impacicncia, Participation laboral y Dinamis- 
mo/Competitividad. Las correlaciones cntre la 
puntuacitSn mixta dc la cscala Tipo A y las trcs 
subcscalas son modestas (.42 a .67), lo cual in- 
dica quc las puntuacioncs factoriales pueden 
proporcionar contribuciones indcpcndicntes a 
la evaluacidn de las tcndencias Tipo A. Las 
normas de la JAS se obtuvieron con 2 588 cm- 
pleados varones de clasc media entre 48 y 65 
aflos de cdad. El instrumento se estandarizd para 
tener una media de 0 y una dcsviacion estdndar 
de 10.0, dondc las calificaciones positivas in¬ 
dican tendcncias Tipo A y las negativas indi¬ 
can lo contrario, tendcncias Tipo B. 

Con el propdsito de una revisidn breve se 
dird quc el patrdn conductual Tipo A consiste 
de inseguridad de estatus, hipcragresividad, 
hostilidad librc flotantc y un sentido de apre- 
mio de tiempo (Friedman y Ulmer, 1984). Al- 
gunos estudios indican quc las personas con este 
patron conductual tienen mayor riesgo de car¬ 
diopatfa coronaria (CC). Por tanto, la identifi- 
cacidn temprana de individuos cn alto riesgo 
podrfa tener implicaciones portentosas para la 
intervcncidn. Antes de la JAS, una enlrcvista 
estructurada prolongada proporcionaba el uni- 
co medio para la idcntificacidn de las personas 
con el patrdn conductual Tipo A. La JAS se 
desarrolld como un intento por duplicar la en- 


trevista estructurada, con lo cual proporciona 
un mdtodo rdpido y economico para detectar la 
conducta Tipo A. 

Por desgracia, la JAS no ha satisfccho sus 
ambiciosas aspiraciones. La confiabilidad test- 
retest de las tres subescalas es marginal, cuan- 
do mucho, con valorcs tan bnjos como .58 para 
Velocidad e impacicncia, .66 para Participacidn 
laboral y .71 para Dinamismo/Compctitividad 
(Bishop, Hailey y O’Rourke, 1989; Igbokwe, 
1989). Lo que es mds, el nivel de concordance 
entre la enlrcvista estructurada y las califica¬ 
ciones de la JAS es s6lo regular, sin alcanzar la 
magnitud suficicnte como para justificar el uso 
de esta prueba para diagndstico individual 
(Yarnold y Bryant, 1988). Otro problcma con 
la JAS es que los pacientes con CC no difiercn 
de los pacientes mddicos en general en cuanto 
a las subcscalas de la prueba. En una compara- 
cidn entre 40 pacientes con CC y 40 con olros 
problemas midicos, Wright (1992) encontrd 
quc la escala de Velocidad c Impacicncia pro- 
dujo una difercneia significaliva y apropiada, 
pero Dinamismo/Compctitividad produjo una 
diferencia significativa en direccidn contraria 
—los pacientes con CC obtuvieron calificacio¬ 
nes mds bajas que aqudllos sin CC. 

Ademds, es obvio que las normas no son 
reprcsentativas, dado que no incluycn a muje- 
rcs, j6venes o ancianos o a personas de niveles 
socioecondmicos bajos. La JAS tambidn tiene 
dificultades en cuanto a su calificacidn manual, 
debido al complejo sistema de ponderacidn que 
se utiliza. Blumenthal (1985) ofrcce una revi- 
si6n poco halagadora de la JAS y recomienda 
que se le utilice s6lo para la investigacidn clf- 
nica y experimental. 

Sin embargo, los investigadores continuan 
cncontrando utilidad en la JAS, aunque ahora 
se reconoce que las subcalificaciones espeeffi- 
cas prcdiccn mejor los problemas dc salud quc 
la calificacidn global (Hart, 1997). 

INVENTARIO DE ANSIEDAD: 
RASGO-ESTADO (IDARE) 

El IDARE es una medida corta y rdpida de la 
ansiedad rasgo y estado que ha recibido alias 
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calificaciones debido a su mcrito tdcnico 
(Spielberger y colaboradorcs, 1983). La ansie- 
dad cstado son los sentimicntos transitorios de 
(emor o preocupacion que la mayorfa experi- 
menta en ciertas ocasioncs. La ansiedad rasgo 
cs la tcndcncia rclativamente estable de un in- 
dividuo a responder de manera ansiosa a una 
situacidn estrcsantc. Estos dos constructos son 
indcpendientcs pcro se rclacionan: el nivel de 
ansiedad rasgo refleja la propensidn a prescn- 
(ar ansiedad estado. 

El IDARE cs una medida con 40 reactivos 
que evakia por separado ambos (ipos de ansie¬ 
dad. Los reactivos cn la pmeba son tdrminos 
simples y descripti vos como "nervioso”, “segu- 
ro” y “relajado". Los 20 reactivos de ansiedad 
cstado se califican en una escala de intensidad 
cuatro puntos, clasificados de la siguiente ma¬ 
nera: “De ninguna manera”, “En cierto modo”, 
“Moderadamente" y “Mucho”. A las personas 
examinadas sc les pide que califiquen estos 
reactivos segun edmo se sientan “en este mo- 
mento”. Los 20 reactivos de ansiedad rasgo sc 
califican en una escala de intensidad de cuatro 
puntos que sc clasifican como “Casi nunca”, 
“A veces", “Con frecuencia” y “Casi siem- 
prc". Se pide a las personas que califiquen estos 
reactivos segun como “se sienten en general”. 

El IDARE sc emplea con estudiantes de 
preparatoria, universitarios y adultos. Una ver- 
si6n similar para nifios, el Stole-Trail Anxiety 
Inventory for Children (Inventario de ansiedad 
estado-rasgo para ninos), se dirige a estudian¬ 
tes de primaria y secundaria. Los aspectos tecni- 
cos de esta prueba son buenos en general y las 
muestras de estandarizacidn son grandes y re- 
presentalivas. Por ejcmplo, la confiabilidad 
test-retest se encuentra en la parte alta del ran- 
go de .70 para ansiedad rasgo y, como podrfa 
predecirse, es mds baja para la ansiedad estado 
(.27 a .62 en diversos estudios). Deben mcn- 
cionarse dos puntos ddbilcs del IDARE. Pri- 
mero, el constructo de la ansiedad rasgo no estd 
bien definido y parece incluir rasgos no re- 
lacionados, como un sentimiento general de 
insatisfaccidn con uno mismo (Chaplin, 1984). 
Ademas, el IDARE es totalmcntc un instmmen- 
to con validez de Facie que puede falsearsc con 
impunidad. Por tal razdn, los resultados en cl 


IDARE deben interpretarse con considerable 
cuidado, en particular cuando la situacidn deman- 
da resultados “sanos” en la prueba. Spielberger 
(1984) ha publicado una bibliograffa amplia de 
estudios de investigacidn con esta pmeba. 

■ INVENTARIOS DERIVADOS 
Da ANALISIS FACTORIAL 


CUESTIONARIO DE 16 FACTORES 
DE LA PERSONALIDAD (16FP) 

El I6FP es una pmeba de personalidad de elec- 
ci6n forzosa que se utiliza ampliamente y que 
cn la actualidad se encuentra disponible en cin- 
co formas independientes. Cada una consiste 
de oraciones parciales de tipo declarativo que 
requieren que la persona examinada responds 
a una situacidn especffica al elegir entre dos 
(Forma E) o tres opciones de eleccidn forzosa 
(formas A, B, C y D). Ejemplos de reactivos 
del tipo de los del 16FP incluycn: 

Tomo decisiones con base en 

a. Sentimicntos. 

b. Senlimientos y razdn por igual. 

c. La razdn. 

iCuSI de los siguientes elementos cs dife- 

rentc de los olros?* 

a. Vela. 

b. Estrella. 

c. Lampara incandescente. 

Me resulta diffcil dar un discurso ante per¬ 
sonas desconocidas. 

a. Sf. 

b. En cierto modo. 

c. No. 


* Al lector pucdcparcccriccuriosa la inclusion cn cl I6FP 
dc lo que parecen ser reactivos de prueba de intcligcn- 
cia. Dc hccho. desde hacc largo liempo los psicdlogos 
ban rcconocido que la personalidad y la inteligcncia 
se encuentran cntrclazadas de manera compleja. La 
mayoria dc autorcs dc pntebas han atendido a este 
dilcma haciendo el intcnlo por separar personalidad e 
intcligencia. En vez de ello, Cattell decidid explorar 
la supcrposicidn entre personalidad c intcligencia al in¬ 
cluir elementos dc ambas dentro de la misma prueba. 
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Las formas contiencn dc 105 a 187 reactivos y 
dificrcn principalmente en el nivel de Icctura 
(de un nivel de tercer grado a uno de primero 
de secundaria). La prucba cs sin Ifmite de tiem- 
po y en general se termina de 30 a 60 minutos. 

El 16FP sc dirige a estudiantes de prepara- 
toria y adultos. La mayor parte dc las normas 
datan dc 1970, lo cual constituyc uno de los 
principales defectos de esta prueba. No obstan¬ 
te. recientemente se obtuvicron normas para la 
Forma E con poblacioncs muy diversas que in- 
cluyeron intemos en prisiones, pacientes con 
esquizofrenia, individuos con limitacioncs cul- 
turales y clientes de rehabilitaci6n ffsica. Sin 
embargo, la mayorfa dc los profesionales csta- 
rfa de acuerdo en que el 16FP cs mis adecuado 
para una poblacidn “normal” que para una con 
“trastomos emocionales". Esta prucba tambidn 
cs util para aplicaciones transculturales (p. ej., 
Argentero, 1989). 

El 16FP se fundamenta en el concepto ana- 
h'tico-factorial dc Cattcll acerca dc la persona- 
lidad (Cattell, Eber y Tatsuoka, 1970). Scgun 
estc modelo, los rasgos superficiales —los as- 
pectos mis obvios dc la personalidad— surgen 
de anilisis simples de los agrupamientos de res- 
puestas dc la prucba. En contrastc, los rasgos 
fuente —los orfgcnes estables y consumes, pero 
menos visibles, de la conducta— surgen s6lo 
de anilisis factoriales cspccializados dc los ras¬ 
gos superficiales (Cattcll, 1950). En una serie 
de cstudios, Cattcll determind que se necesitan 
16 factorcs o rasgos fuente de la personalidad 
para explicar la estructura de las respuestas dc 
la prueba, de aquf el nombre de su instrumento. 

El 16FP produce un total dc 20 fndices o 
alributos de la personalidad. Adcmas de las 16 
escalas bisicas, se calculan cuatro indices de 
segundo orden de la personalidad a partir de las 
sumas lineales ponderadas de los 16 indices 
anteriores, lo cual produce un total de 20 esca¬ 
las bipolares. A lo largo de los anos, se ha esta- 
blecido con claridad cl significado de las 
calificaciones extremas en cualquier direccidn 
(cuadro 14-2). 

El principal empuje para la aplicacidn del 
16FP es la orientacidn de carrcra, la explora- 
cion vocacional y las pruebas de seleccidn la¬ 


teral. Una raz6n para la popularidad del instru¬ 
mento —es el segundo mils utilizado despuds del 
MMPI/MMPI-2— es que las hojas de respuesta 
se pueden enviar por correo para calificacidn 
electr6nica rapida. La mayorfa dc los profesio¬ 
nales tambidn solicitan un informe narrativo 
gencrado por computadora. Una caracterfstica 
atracliva dc estos informes es el cumulo de in- 
formacidn que proporcionan. Estos incluyen una 
dcscripcidn resumida de la personalidad, perfil 
dc calificaciones y resumen de signos clfnicos, 
factores cognitivos y patrones de ncccsidades. 

Una dc las principales deficiencias del 16FP 
es que los 16 atributos de personalidad exami- 
nados se basan nada mis en 10 a 13 reactivos 
cada uno. Es inevitable que una prueba con es¬ 
calas tan cortas como dstas tenga una confia- 
bilidad baja. Por tanto, no es de sorprender que 
las confiabilidades por mitades de los 16 facto¬ 
rcs sea tan baja como .54; las correlacioncs 
entre las mismas escalas para las diferentes for¬ 
mas de la prucba sc colocan por lo comdn alre- 
dedor de .50 y los cocficientes test-retest para 
las escalas dentro de la misma forma son de 
.70 y .80 para aplicaciones cl mismo dfa o al 
siguiente, pero mucho mis bajas para interva- 
los mayores. 

La mayor parte de la evidencia en favor del 
16FP consiste de demostraciones estadfsticas 
dc que los reactivos “pertenecen” a sus respec- 
tivas escalas y dc que dstas consisten dc facto¬ 
res relativamente puros. La evidencia en este 
sentido es razonablemente alentadora (Cattell, 
Eber y Tatsuoka, 1970). Adcmis. algunos es- 
tudios con el 16FP demuesuan que los corre¬ 
lates objetivos de los resultados de la prueba 
son consistentes con la teorfa. Por cjemplo, 
Cattell y Nesselroade (1967) estudiaron la seme- 
janza de los perfiles del 16FP de 102 parejas 
con matrimonios estables y 37 con malrimo- 
nios incstablcs. Estos autores dcscubricron que 
las parejas con matrimonios estables son mu¬ 
cho mis similares en el 16FP que aqudllas con 
matrimonios incstables. El lector observari en 
el cuadro 14-3 que las correlaciones entre es¬ 
calas para las parejas con matrimonios estables 
son casi todas uniformemente positivas —lo 
cual significa que dstas producen calificacio- 
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Cuadro 14-2. Los 16 factores de personalldad y 4 indices 
de segundo orden del 16FP 


Nombre del factor 

Interpretation de las 
calificaciones bajas 

Interpretation de las 
calificaciones altas 

Calidez 

Reservado, lejano, frfo, impersonal CAIido, expresivo, gusta de las per¬ 
sonas 

Inteligencia 

Pensamiento concreto 

Pensamiento abstracto, inteligente 

Estabilidad emocional 

Menos estable a nivol emocional, 
cambiante 

Estable a nlvel emocional, calmado, 
maduro 

Dominancia 

Sumlso, conformista, placido 

Dominante, asertivo, competitivo 

Impulsividad 

Serio, prudente, sobrio, tacitumo 

Entusiasta, alegre, Irresponsable 

Conformidad 

Oportunista. desdena las reglas 

Conformista, perseverante, moralists 

Audacia 

Tlmido, reservado, refrenado 

Atrevido, desinhibido, espontAneo 

Sensibilidad 

Riguroso, confiado en s( mismo 

Indulgente, sensible 

Suspicacia 

Confiado, adaptable 

Suspicaz, diffcil de engafiar, dogmA- 
tico 

Itnaginacion 

PrActico, convencional 

Poco prActico, distrafdo, poco con¬ 
vencional 

Astucia 

Direclo, genuino, sin pretensiones Calculador, refinado, socialmenle 

alerta 

Inseguridad 

Confiado, satisfecho consigo mis¬ 
mo, seguro 

Se culpa a sf mismo, preocupado, 
angustiado 

Radicalismo 

Conservador, se resiste al cambio 

Liberal, analitico, innovador 

Autosuficiencia 

Orientado al grupo, sociable 

Ingenioso, autosuficiente 

Autodisciplina 

Indisciplinado, impulsivo 

Compulsivo, socialmenle preciso 

TensiAn 

relajado, tranquilo, poco impulso 

Frustrado, energAUco, tenso 

Extraversion (Q ( ) 

Introve rsi6n 

Extraversidn 

Ansiedad (Q a ) 

Baja ansiedad 

Ansiedad elevada 

Apariencia de dureza (QJ 

Sensibilidad, emocionalidad 

Apariencia de dureza 

Independencia (QJ 

Dependencia 

Independencia 


Fuonte: Basado en Whotebon, B. E. (1907). Sixteen Personality Factor Questionnaire En 0. J. Keyser y R. C. Sneertand (eds ). Tost 
critiques compendium. Kansas City. MO: Test Corporation ol America TambWn en Cattell. R B (1986) The handbook ot the IS 
Personality Factor Questionnaire Champaign. IL: Institute lor Personality and Ability Testing. 


nes si mi I arcs en las cscalas del 16FP —mien- 
tras que mds de la mitad de las correlaciones 
entre escalas para tos matrimonios incstables 
son negativas— lo cual significa que estas pa- 
rcjas producen con frecuencia califtcaciones 
cscalares diferentes en el 16FP. Estos datos sus- 


tcntan el punto de vista de que la semejanza 
facilita la estabilidad en el matrimonio.* Mds 
importante aun es que los resultados refuerzan 
la validez del 16FP al moslrar que los rcsulta- 
dos de la pnieba tienen implicaciones significa- 
tivas y anticipatorias en el mundo real. 


* Otra posibilidad es que. en los tnalrimonios estables, las personalidadcs de los micmbros evolucionen a una mayor 
semejanza con los aflos. Por supuesto. ambos factores pueden opcrar de mancra simultdnea. 
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Cuadro 14-3. Intercorrelaciones para los factores del 16FP 
con matrimonios estables e inestables 


Factor del 16FP 

Correlacidn para 
matrimonios estables 
(N° 102) 

Correlacidn para 
matrimonios inestables 
(A/ = 37) 

Valor p de la 
diferencia 

A Calidez 

.16 

-.50 

<.001 

B Inteligencia 

.31 

.21 

ns 

C Fortaleza del yo 

.32 

.05 

ns 

E Dominancia 

.13 

.31 

ns 

F Impulsividad 

.23 

-.40 

<.001 

G Conformidad 

.33 

.19 

ns 

H Audacia 

.23 

.12 

ns 

1 Senslbilidad 

-.15 

-.13 

ns 

L Suspicacia 

.18 

-.33 

<.01 

M Imaginacidn 

.22 

-.01 

ns 

N Astucia 

.18 

.27 

ns 

0 Inseguridad 

.11 

.36 

ns 

Q, Radicalismo 

.27 

.34 

ns 

Q, Aulosuliciencia 

.15 

-.32 

<.01 

Q, Autodisciplina 

.27 

-.02 

ns 

Q 4 Tensidn 

.16 

-.11 

ns 

0, Extraversidn 

.22 

-.30 

<.01 

0, Ansiedad 

.31 

.23 

ns 


Fuonto: Adaptado con autorizacidn de Cattell, R B y Nesselroade. J.R (1967). Likeness and completeness theories examined by 
Sixteen Personality factor measures on stabty and unstably married couples. Journal of Personality and Social Psychology, 7 .351 -361 


CUESTIONARIO DE PERSONALIDAD 
DE EYSENCK 

El Cuestionario dc Personalidad de Eysenck 
(EPQ) es el ultimo en una scrie de prucbas di- 
scfiadas para medir las principales dinicnsio- 
nes dc la personalidad normal y anormal 
(Eysenck y Eysenck. 1975). Con base en toda 
una vida de invcstigacidn analilico-factorial con 
el cuestionario y de experimentos dc laborato¬ 
ry sobre aprendizaje y condicionamiento, 
Eysenck aisld tres dimensiones principales de 
la personalidad: Psicoticismo (P), Extraversion 
(E) y Ncuroticismo (N). El EPQ consiste de es- 
calas para medir estas dimensiones y tambidn 
incorpora una escala de Mentira (L) para eva- 
luar la validcz de las respuestas de una persona. 
El EPQ contiene 90 afirmacioncs que sc respon- 
den con ‘‘Sf ’ o "No” y se disend para personas 


dc 16 anos y mayores. Un EPQ para individuos 
mis jdvenes tienc 81 afirmacioncs y es adecua- 
do para niiios entre 7 y 15 ados de edad. 

Los reactivos en la escala P se parcccn a 
los siguientes: 

iCon frccuencia quebrantas las reglas? (V) 
iTe preocuparfas si tuvieras dcudas? (F) 
^Te expones a riesgos sdlo por diver- 
si6n? (V) 

Las calificaciones altas en la escala P indican 
rasgos agresivos y hostiles, impulsividad, una 
preferencia por cosas extranas o poco comu- 
ncs y defectos de empatia. Es frecuente que los 
pacientes anlisociales y esquizoides obtengan 
altas calificaciones en esta dimensidn. En con- 
Iraste, las bajas calificaciones en P prediccn 
caracterfsticas mis deseables como empatia y 
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sensibilidad interpersonal. Los reactivos en la 
escala E sc parecen a los siguientes: 

^Te agrada conocer a nuevas personas? (V) 

^Ercs silencioso cuando estis con otras per¬ 
sonas? (F) 

i,Te gustan las grandcs cmociones? (V) 

Las calificaciones altas en la escala E indican 
una persona llamativa, gregaria. extravertida, 
amante de las diversiones. Las bajas califtca- 
cioncs en la escala E representan rasgos de in- 
troversidn, como la preferencia por la soledad 
y las actividades tranquilas. Los reactivos en la 
escala N sc parecen a los siguientes: 

^Eres una persona taciturna? (V) 

^Consideras que la vida es aburrida? (V) 

^Es ficil que lastimcn lus sentimientos? (V) 

La escala N refleja una dimensidn de emocio- 
nalidad que va de una personalidad nerviosa, 
desadaptada y excesivamente emocional (alias 
calificaciones) a una estable y confiada (ba¬ 
jas calificaciones). 

La confiabilidad del EPQ es excelcnte. Por 
ejemplo, las corrclacioncs test-reiest a un mes 
Tueron de .78 (P). .89 (E). .86 (N) y .84 (L). 
Las consistences intemas se colocaron en el 
rango de .70 para P y de .80 para las otras tres 
escalas. La validez de constructo del EPQ tam- 
bidn se establecid de manera adecuada a travds 
de docenas de estudios que utilizaron criterios 
conductuales, emocionales, de aprendizaje, de 
atencion y terapduticos (revisados en Eysenck 
y Eysenck. 1976, 1985). Friedman (1987) pro- 
porciona una introducci6n corta pero completa 
a otras fuentes sobre el EPQ. 

Uno de los principalcs puntos de atcncidn 
de la investigacidn con el EPQ se ha colocado 
en los correlatos empiricos de la extraversion 
y su polo opuesto, la introversion. Eysenck y 
Eysenck (1975) describen al extravertido tfpi- 
co como sigue: 

El extravertido tipico es sociable, gusta de las 
fiestas, liene muchos amigos, neceslta tener 
personas con quienes hablar y no gusta de leer 
o estudlar por sf solo. Ansla las emociones. loma 
rlesgos, con frecuencia se destaca. actua sin 
pensar y en general es un Individuo Impulsivo. 


Estos autores describen al introvertido tipico 
de la siguientc manera: 

B Introvertido tipico es el tipo de persona tran- 
quila, retralda, introspectiva que gusta de los II- 
bros m^s que de las personas; es reservado y 
distante, excepto con amigos intimos. Tlende a 
planear de antemano, "mira antes de saltar* y 
desconffa del Impulso del momento. 

Eysenck y sus scguidorcs han vinculado varios 
factores perceptuales y fisioldgicos con la di¬ 
mensidn de extraversidn/introversidn. Debido 
a las limitaciones de espacio sdlo pueden enu- 
merarsc aquf las conclusiones representativas: 

• Los introvertidos son mis cuidadosos en ta- 
reas de vigilancia. 

• Los introvertidos tienen mejor desempefio en 
(areas de deteccidn de senates. 

• Los introvertidos son menos tolerantes al do¬ 
lor. pero mis a la privacidn sensorial. 

• A los extravertidos se les puedc condicionar 
con mayor facilidad a estfmulos asociados con 
excitacidn sexual. 

• Los extravertidos tienen mayor neccsidad de 
estimulacidn externa. 

Aiken (1989) resume la investigacidn adicio- 
nal sobre los correlatos objetivos de la dimen- 
sidn de extraversidn/introversidn del EPQ. 

En general, las caracterfsticas tdcnicas del 
EPQ son muy fuertes, seguramente mis de lo 
que se encuentra en la mayor parte de los 
inventarios de autoinformc. La utilidad pricti- 
ca del instrumento se sustenta en una volumi- 
nosa literatura de investigacidn. No obstante, 
cl EPQ nunca ha atrapado la atencidn de los 
psicdlogos en EUA, quienes parecen enamora- 
dos de los instrumentos multifisicos que pro- 
ducen 10,20 o 30 calificaciones y no un simple 
trfo de dimensiones bisicas. 

ESCALAS COMREY DE 
PERSONALIDAD 

Para los profesionalcs que desean un inventario 
corto de autoinforme, adccuado para estudian- 
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tes univcrsitarios y otros adultos, las Comrey 
Personality Scales, CPS (Escalas Comrey de 
personalidad; Comrey, 1970, 1980), serian la 
eleccidn adecuada. Como protcgido dc Guilford, 
Comrey siguid una cstrategia analftico-factorial 
para desarrollar su prueba de 180 reactivos. 
Comrey se bas6 de manera exclusiva en cstu- 
diantes universitarios para el desarrollo y cslan- 
darizacion dc su prueba, dc modo que las CPS 
son adccuadas para la cvaluacidn dc la perso¬ 
nalidad en esta subpoblacidn. 

Una virlud especial dc las CPS cs su bre- 
vedad. La prueba consiste de 180 afirmaciones 
y, por tanto, es de sdlo un tercio de la extensidn 
dc instrumentos compctidores como el MMPI-2. 
Las ocho escalas de personalidad CPS consis- 
ten de 20 reactivos cada una, divididos por igual 
entre afirmaciones redactadas en direccidn po- 
siliva y negativa. Otros 20 reactivos se dedican 
a una vcrificacidn de la validez y a evaluar la 
propensidn de respuesta dc descabilidad social. 

La siguiente descripcidn de las escalas CPS 
se basa en Mcrcnda (1985): 

(V) Verification dc validez. La puntuacidn 
natural esperada es de 8. Sin embargo, 
cualquier calificacidn en la eseala V que 
produzca un equivalente en puntuacidn 
T por debajo de 70 se encuentra todavfa 
dentro del rango normal. Las califica- 
cioncs m&s alias sugicrcn un protocolo 
inv&fido. 

(R) Sesgo de respuesta. Las calificacioncs 
altas indican una tcndcncia a responder 
a las preguntas de manera socialmente 
deseable, que hace que el individuo pa- 
rezea una persona "agradable". 

(T) Confianza contra defensividad. Las 
altas calificaciones indican una creen- 
cia en la honradez bdsica, confiabilidad 
y buenas intenciones de otras personas. 

(O) Sentido de orden contra falta de 
compulsidn. Las calificaciones altas 
son caracterfsticas de individuos cuida- 
dosos, mcticulosos, ordenados y suma- 
menle organizados. 

(C) Conformidad social contra rebeldia. 

Los individuos con altas calificaciones 


accptan a la sociedad como es, resien. 
ten la inconformidad en otros, buscan 
la aprobacidn de la sociedad y respe- 
tan las leyes. 

(A) Actividad contra falta de energia. Los 

individuos con calificaciones altas tie- 
nen gran canlidad de energfa y resisten- 
cia, trabajan de manera intensa y bus- 
can sobresalir. 

(S) Estabilidad cmodonal contra neuro- 
ticisrno. Las personas con calificacio¬ 
nes altas estiin fibres dc depresidn, son 
optimistas, relajados, con un cstado de 
dnimo estable y son confiados. 

(E) Extravcrsidn contra introversidn. Los 
individuos con calificaciones altas co- 
nocen personas con facilidad, buscan 
nuevos amigos, se sienten edmodos con 
los desconocidos y no sufren de miedo 
cscdnico. 

(M) Masculinidad contra feminidad. Los 

individuos con calificaciones altas tien- 
den a ser personas bastante rigurosas a 
quienes no les molesta la sangre, los in- 
sectos rastreros, la vulgaridad y que no 
Horan con facilidad o muestran mucho 
interes en historias dc amor. 

(P) Empati'a contra egocentrismo. Los in¬ 
dividuos con calificaciones altas se des- 
criben como personas utiles, generosas, 
compasivas que estdn interesadas en 
dedicar su vida al scrvicio de los demAs. 

Como refiejo dc su cuidadosa derivacidn ana- 
Iftico-factorial, las escalas CPS poseen excep- 
cionalcs consistencias intemas que van de .91 
a .96. Estas conclusiones indican que es m£s 
probable que las CPS constituyan una prueba 
confiable, pero los datos tradicionales de con- 
fiabilidad test-retest son escasos. Los estudios 
transculturales con las CPS dan un fuerte apo- 
yo a su validez. Brief y Comrey (1993) infor- 
man que los andlisis factoriales en muestras 
rnsas, estadounidenscs, brasileftas, israelfes, ita- 
lianas y neozelandesas producen una solucidn 
de ocho factores para las rcspucstas de los rcac- 
tivos CPS. Otros estudios de validacidn con estas 
escalas no son tan directos en su interprelacidn. 
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por un lado, las correlaciones entre las califica- 
ciones de las escalas CPS y los datos biogrdfi- 
cos relacionados con la personalidad son muy 
pequenas (Comrey y Backer, 1970; Comrcy y 
Schicbel, 1983). Por otro, las calificaciones 
extrcmas en las escalas CPS se rclacionan en 
gran medida con traslomo psicoldgico (Comrey 
y Schicbcl, 1985). Esloes particularmentecierto 
en cuanto a las bajas calificaciones en Confian- 
ia contra defensividad. Actividad contra falta 
dc energfa, Estabilidad emocional contra neu- 
roticismo, Extraversidn contra introversidn y las 
alias calificaciones en Sentido de orden contra 
falta de compulsidn. En general, los crfticos 
concluycn quc las CPS son escalas promctcdo- 
ras que nccesitan actualizar su estandarizacidn 
adcmds de documentacidn adicional sobre sus 
cualidades tecnicas. 


INVENTARIO NEO OE PERSONAUDAD- 
REVISADO 

El Invcntario NEO dc Personalidad-Rcvisado 
(NEO PI-R) engloba decadas de investigacidn 
analftico-factorial con poblaciones adultas, clf- 
nicas y normales (Costa y McCrae, 1992). La 
prueba se basa en el modclo de cinco factores 
dc la personalidad quc se describe en el capita* 
lo anterior. Estd disponible en dos formas para- 
lelas que consisten de 240 rcactivos calificados 
en una dimcnsidn de cinco puntos. Se utilizan 
tres rcactivos adicionales para verificar la vali¬ 
dez. Tambicn estii disponible una versidn mas 
corta, el Invcntario NEO dc cinco factores 
(NEO-FFI; Costa y McCrae, 1989). Aquf se li- 
mita la discusidn al NEO PI-R. La Forma S es 
para autoinformes, mientras que la Forma R 
cs para observadores cxtcmos (p. ej., cdnyuge 
del clicntc). El formato de los rcactivos consis- 
te de calificaciones en cinco puntos: fuerte- 
mente en desacuerdo, en desacuerdo, neutral, 
de acuerdo, fucrtemente de acucrdo. Los 
rcactivos evaluan variables emocionales, in- 
terpcrsonalcs, experienciales, actitudinales y 
molivacionales. 

Las escalas para los cinco dominios en el 
NEO PI-R sc basan cada una en scis escalas de 


faceta (rasgo) (cuadro 14-4). La consistencia 
intema de las escalas es soberbia: de .86 a .95 
para las escalas de dominio y .56 a .90 para las 
escalas de faceta. Los coeficientes de estabili¬ 
dad van de .51 a .83 en cstudios longitu¬ 
dinals de tres a siete anus. La evidcncia dc la 
validez del NEO PI-R cs suslancial y se basa 
en la correspondence de las calificaciones en¬ 
tre la persona y su cdnyuge, correlaciones con 
otras pruebas y listas dc verificaci6n y en la 
validez de constructo del modelo de los cinco 
factores en sf (Costa y McCrae, 1992a; Piedmont 
y Weinstein, 1993). Trull. Uscda, Costa y McCrae, 
1995). 

El NEO PI-R es una excelente medida de 
la personalidad normal que es especialmente 
titil en investigacidn. La prueba tambidn resul- 
ta prometedora como medida de la psicopato- 
logfaclfnica. Porejemplo, Clarkin, Hull, Cantor 
y Sanderson (1993) enconlraron que los pacicn- 
tes con un diagndstico de trastomo limftrofe de 
la personalidad obtuvieron calificaciones muy 
altas en Neuroticismo y muy bajas en Confor- 
midad, lo cual concuerda en gran medida con 
la respuesta dc todo clfnico hacia estos pacicntcs 
desafiantes. Una preocupacidn menor accrca del 
instrumento es su falta de escalas sustancialcs 
de validez —s61o tres reactivos evaluan este as- 
pecto. La aplicacidn del NEO PI-R supone que 
los individuos son cooperatives y razonablc- 
mente sinceros. 6sta es en general una suposi- 
ci6n segura en entomos de investigacidn, pero 
puedc no rcsultar cierta en ambientes forenses, 
de seleccidn de personal y psiquiatricos. 

I INVENTARIOS CON 

CODIF1CACI6N DE CRITERIO 


Los inventarios dc autoinforme que se revisa- 
riin por ultimo engloban una estrategia dc dc- 
sarrollo de una prueba con codificaci6n de 
criterio. En un enfoque de codificacidn de cri- 
terio, los rcactivos de una prueba se asignan a 
una escala particular si, y s6lo si, discriminan 
entre un grupo de criterio bicn definido y uno 
control relacionado. Por ejemplo, para disenar 
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Cuadro 14-4. Escalas de dominlo y facetas (rasgos) del NEO Pl-R 


Dominios 


Facetas 

Neuroticismo 

Ansiedad 

Timidez 


Hostilidad con enojo 

Impulsivldad 


Depresion 

Vulnerabilidad 

ExtraversiOn 

Calidez 

Actividad 


Sociabilidad 

Busqueda de emociones 


Asertividad 

Emocionos positivas 

Apertura a la experience 

Fantasia 

Acciones 


Estdtica 

Ideas 


Sentimientos 

Valores 

Conformidad 

Confianza 

Sumisibn 


Franqueza 

Modestia 


Altruismo 

Indulgence 

Escrupulosidad 

Competencia 

Esfuerzo dirigido al logro 


Orden 

Autodisciplina 


Diligencia 

Deliberation 


una escala de autoinforme para la depresidn, 
los reactivos que las personas deprimidas con- 
firman con una frecuencia significativamente 
mayor (o mcnor) quc los controlcs normales se 
asignarfan a la escala de depresidn y se codifi- 
cart'an cn la direction apropiada. Podrfa uti- 
lizarse un enfoque similar para otros constructos 
de interns para el clfnico, como la esquizofrenia, 
reaction de ansiedad y similares. VOase quc el 
autorde la prucba no consulta ninguna teoria de 
la esquizofrenia, la depresiOn o la reaction de 
ansiedad para determinar curies reactivos per- 
tenecen a las diferentes escalas. La esencia del 
procedimiento con codification de criterio cs, 
por asf decir, dejar que los reactivos caigan 
donde sea.* 


• En este caso se cstin pasando por alto cienas caracte- 
risticis complejas. Algunos reactivos que reflejan psi- 
copatologta general podrian disc rim mar a todos los 
grupos dc contrastc con rcspccto al grupo control. El 
autor de la prucba podria dcscartar dstos en favor de 
reactivos que discrimincn de manera difeiencial cn el 
caso dc un grupo de contrasie pero no en los demis. 


INVENTARIO MULTIFASICO DE LA 
PERSONALIDAD DE MINNESOTA-2 
(MMPI-2) 

Publicado inicialmente en 1943, el MMPI era un 
invcntario de personalidad con 566 reactivos de 
cierto/falso disenado en un principio como 
auxiliar para cl diagnOstico psiquidlrico 
(Hathaway y McKinley, 1940, 1942, 1943; 
McKinley y Hathaway. 1940,1944; McKinley, 
Hathaway y Meehl, 1948). Los autores de la 
prueba siguieron un cstricto enfoque de codifi- 
cacion de criterio para la construction de las 
escalas del MMPI. Las escalas clfnicas se de- 
sarrollaron al contrastar las respuestas dc grupos 
cuidadosamente dcfinidos de pacicntes psiquid- 
tricos (JV promcdio dc cerca de 50 personas) con 
las respuestas de 724 personas control. El re- 
sultado fue una notable prueba util tanto en la 
evaluation psiquidtnea como en la description 
de la personalidad normal. Despuds de unos 
cuantos aiios, el MMPI se convirti6 cn la pruc¬ 
ba de personalidad de uso mds amplio cn EUA. 

Al principio, el MMPI envejeciO con gra¬ 
tia; los profesionales toleraron lo que parecian 
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ser defectos menores. Pero a medida que la 
prucba alcanzo la mediana cdad, se volvid cada 
vez mas obvia la necesidad de un rejuveneci- 
miento. El problema mds grave residfa en el 
grupo control original, que consistid principal- 
mcnte de familiares y visitantes de los pacien- 
tes mddicos cn el Hospital de la Universidad 
de Minnesota. La eleccidn estrecha dc personas 
control, examinadas principalmente durante el 
deccnio de 1930, result6 ser una pertinaz fuen- 
te de crfticas hacia el instrumento. Todas las 
personas control eran de raza blanca y la ma- 
yorfa eran jdvenes (edad promedio 35 afios), 
casadas y provcnicnlcs dc un pequcfio pueblo 
o del drea rural. £sta fue una muestra de con- 
veniencia que era signifleativamente no repre- 
sentativa de la poblacidn cn general. 

El contcnido de los reactivos del MMPI 
tambidn hizo sutgir preocupaciones (Graham. 
1993). Varios de ellos utilizaban una termi- 
nologfa arcaica y obsoleta, como “tirar el 
pafiuelo" (un juego dc saldn del deccnio de 
1930), polvos para dormir (pfldoras para dormir) 
y tranvfas (autobuses eldctricos). Otros em- 
pleaban un lenguaje sexista. Los individuos exa- 
minados pensaban que algunos reactivos eran 
inaccptables, en especial aquellos que se relacio- 
naban con creencias religiosas cristianas. Es- 
tos reactivos fueron causa de demandas legales 
ocasionales que alegaban una invasidn de la vida 
privada. Por ultimo, unos cuantos reactivos que 
trataban sobre funciones fisioldgicas y conducta 
sexual eran francamente ofensivos. 

Dcsde el punto de vista de la medicidn, un 
problema mds grave en el contenido de los reac¬ 
tivos era la omisidn. El conjunto original de 
reactivos del MMPI no tem'a la suficiente am- 
plitud como para evaluar muchas caracterfsticas 
importantes, como tcndcncias suicidas, abuso 
de estuperacicntes y conductas relacionadas con 
el tratamiento. Un motivo adicional para la re- 
visidn del MMPI consistid en aumentar el ran- 
go de cobcrtura de los reactivos. 

El MMPI-2 se publied en 1989 despuds de 
casi una ddcada de revisidn y reestandarizacidn. 
El nuevo y mejorado MMPI-2 incorpora una 
muestra normativa contempordnea de 2 600 
individuos que son aproximadamentc represen¬ 


tatives de la poblacidn general en cuanto a las 
variables demogrdficas principales (localizacidn 
geografica, raza, edad, nivel ocupacional e in- 
gresos). Aunque los niveles superiores de edu- 
cacidn ticnen una representacidn excesiva, la 
muestra normativa del MMPI-2 sigue siendo 
una notable mejorfa con respecto a la del MMPI. 
Se ha mejorado de manera significativa la re- 
serva de reactivos al revisar aquellos obsoletos, 
eliminar los ofensivos y anadir nuevos reactivos 
para extender la cobertura del contcnido. 

El MMPI-2 representa una mejorfa signi¬ 
ficativa con respecto al MMPI, pero conserva 
una continuidad sustancial con su estimado 
antecesor. Los autores de la prucba conserva- 
ron los mismos tftulos y objetivos de mcdicidn 
para las escalas tradicionalcs clfnicas y dc vali- 
dez. La reestandarizacidn proporciona una me- 
jor calibracidn para las elevacioncs dc escala, 
una mejorfa que era muy nccesaria (Tcllegen y 
Ben-Porath, 1992). Aunque se volvieron a re¬ 
dactor docenas de reactivos, estas revisiones son 
dc apariencia y no afectan las caracterfsticas 
psicomdtricas de la prueba (Ben-Porath y 
Butcher. 1989). De hecho, cuando muestras 
grandcs de personas responden al MMPI y al 
MMPI-2, las calificaciones para las escalas in¬ 
dividual clfnicas y de validez se conrelacionan 
por lo comun en cerca de .99. 

El MMPI-2 consiste de 567 reactivos cui- 
dadosamente disehados para evaluar una am- 
plia gama de preocupaciones. Se le pide al 
examinando que marque “Cierto" o “Falso” 
para cada afirmacidn, segun se le aplique. La 
mayor parte dc los reactivos son autorrefe- 
renciales. Los reactivos engloban los siguien- 
tes temas generales (Dahlstrom, Welsh y 
Dahlstrom, 1972; Graham, 1993): 

Preocupaciones dc salud. 

Sfntomas neuroldgicos. 

Problemas familiares. 

Relaciones matrimoniales. 

Problemas laborales. 

Sfntomas depresivos y maniacos. 

Estados obsesivos y compulsivos. 

Delirios y alucinaciones. 

Ansiedad y fobias. 
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Control del cnojo. 

Practicas antisociales. 

Abuse dc sustancias prohibidas y alcohol. 

Autoestima. 

Incomodidad social. 

Conducta lipo A. 

Masculinidad-feminidad. 

Indicadores negativos dc tratamiento. 

Validezde respuesta; porejcmplo, virtudes 
improbablcs. 

El MMPI requiere un nivel dc Icctura de sexto 
grado y la mayorfa de los individuos termina 
de responderlo en 1 a 1.5 horas. 

Las escalas originales del MMPI se desa- 
rrollaron al contrastar las respucstas a los 
reactivos dc grupos cuidadosamente dcfinidos 
de pacientes psiquiOlricos (N promedio de 50) 
con aquellas de aproximadamente 700 perso¬ 
nas control. Los grupos de pacientes psiquiO- 
tricos incluyeron las siguientes categories 
diagnOsticas: hipocondriasis, depresiOn, hisle- 
ria, psicopatfa, homosexualidad masculina, 
paranoia, psicastenia*, esquizofrenia y fascs 
iniciales de manfa (hipomanfa). Ademds, se uti- 
lizaron muestras de estudiantes universitarios 
socialmcntc introvertidos y extravertidos para 
construir una escala de introversion social. El 
MMPI-2 conserva las escalas clfnicas bOsicas, 
con unos cuantoS cambios mcnores dc elimi- 
naciOn y revision. Ben-Porath y Butcher (1989) 
investigaron las caracterfsticas de los reactivos 
que volvieron a redactarse cn el MMPI-2 y des- 
cubrieron que son psicomOtricamente equiva- 
lentes a los originales. 

El MMPI-2 puede calificarse para cuatro 
escalas de validez, 10 escalas clfnicas estdndar 
y doccnas de escalas complcmcntarias. En la 
prOctica, los clfnicos le dan mayor Onfasis a las 
escalas clfnicas estandar y a las de validez. 
Las escalas complcmcntarias son sOlo eso —un 
complcmcnto. Proporcionan informaciOn util 
para afinar la intcrprctaciOn de las escalas clfni¬ 
cas y de validez tradicionales. Las puntuacio- 


• Estc tlrmino diagn6stico arcaico cs bastante similar a 
lo que ahora se denominarta trastomo obsesivo-com- 
pulsivo. 


nes naturales en las escalas del MMPI-2 se con- 
vierten a puntuaciones T, con una media de 50 
y desviaciOn estandar de 10. Las calificaciones 
que superan la puntuaciOn Tdc 65 mereccn con- 
sidcraciOn especial. Estas son estadfsticamentc 
poco comunes dentro de la poblaciOn general y 
pueden significar la presencia de sintomatolo- 
gfa psiquiatrica. Aquf nos concentniremos en las 
escalas tradicionales, comenzando con una re¬ 
vision de las cuatro escalas de validez conoci- 
das como No puedo deeir (?). L, F y K. 

La calificaciOn de frascs omitidas es sim- 
plementc cl numcro total dc reactivos omitidos 
o con doblc respuesta en cl llenado dc la hoja 
de respuestas. Las instrucciones para la prueba 
estimulan a las personas examinadas a respon¬ 
der todos los reactivos, pero ocumran omisiones 
o doblcs respuestas. No obstante, esto es poco 
comun —el numero modal de reactivos omiti¬ 
dos cs dc cero (Tamkin y Scherer, 1957). Iji 
omisiOn dc hasta 10 reactivos parece tener poco 
efecto sobre los resultados globules de la 
prueba —uno de los beneficios de tener un 
conjunto tan grande de afirmacioncs cn cl 
MMPI-2. Una calificaciOn muy alta en esta cs- 
cala puede indicar un problema de lectura, opo- 
siciOn a la autoridad, defensividad o indecisiOn 
producida por depresiOn. 

La Escala L se componc de 15 reactivos 
que se califican todos en la dirccciOn dc falso. Al 
responder “falso” a los reactivos dc la Escala L, 
la persona examinada afirma que posec un grado 
de virtudes personates que se observa en pocas 
ocasiones cn nuestra cultura (p. ej., nunca se 
enoja, siente agrado por todos, nunca miente, 
lee todos los cditoriales del periOdico y preferi- 
rfa perder a ganar). La Escala L se disefiO para 
identificar una actitud general deliberadamen- 
te evasiva al realizar la prueba. Una califica¬ 
ciOn alta en la Escala L indica que el individuo 
no sOlo es defensivo, sino que tambiOn lo hacc 
de manera inocente. Las personas con algun 
grado dc complejidad psicolOgica pueden adop- 
tar una actitud defensiva al responder la prue¬ 
ba y de todos modos obtener una calificaciOn 
dentro del rango normal en la Escala L. 

La Escala F consiste de 60 reactivos que 
los individuos normales responden en la direc- 
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ciOn calificada en no mis de 10% de las oca- 
siones. Estos reflejan un amplio espectro de 
desadaptacibn grave, incluyendo pensamientos 
peculiares, apatfa y enajcnaciOn social. Aun- 
que los reactivos de la Escala F pareccn indi¬ 
car patologfa psiquiatrica, en pocas ocasioncs 
los pacicntes responden a cllos en la direcciOn 
esperada. Mcnos de S0% de esios reactivos apa- 
reccn en las escalas clfnicas. No obstante, mu- 
chas personas con trastornos psiquiitricos 
importantes sf llegan a producir calificacioncs 
elevadas, en el rango de 7=70 u 80 en la Escala 
F. Por otro lado, las calificacioncs cxcepcional- 
mentc elevadas sugieren hip6tesis adicionales: 
capacidad de lectura insuficientc, respucstas 
aleatorias o de falla de coopcracidn, un intento 
motivado de “parecer malo” en la prueba o un 
exagerado “llamado de ayuda" en el caso de 
un clicntc angustiado. 

La Escala K se disend para ayudar a detec- 
tar una forma sutil de defensividad. La escala 
con 30 reactivos se componc, en parte, de 22 que 
difcrcncian los perfiles normales producidos por 
pacicntes psiquiatricos hospitalizados que 
muestran defensividad de aquellos que produccn 
los controlcs normales. Ademas se anadicron 
ocho reactivos que mejoran la discriminaciOn 
de sfntomas depresivos y csquizofrdnicos 
(McKinley, Hathaway y Mechl, 1948). Una 
calificacibn elevada en la Escala K puede indi¬ 
car una actitud defensiva al responder la prue¬ 
ba. Las elcvaciones dentro del rango normal en 
la Escala K sugieren buena fortalcza del yo 
—la prcscncia de defensas psicolbgicas Olilcs 
que permiten que la persona funcionc bicn a 
pesar de conflictos intemos. 

El uso combinado de las escalas F y K pue¬ 
de ser util para la deteccibn de perfiles del 
MMPI-2 donde existe falsificacibn o simula- 
ci6n. En un estudio, 81% de los perfiles en los 
que se simulaba “ser bueno” se identificaron a 
travds de la sencilla regia de decision (utilizan- 
do las puntuacioncs naturales) de F-K < 12, 
mientras que 87% de los perfiles en los que 
se simulaba “ser malo” se identificaron por 
una simple regia de decision (utilizando pun¬ 
tuacioncs naturales) de F-K > 7 (Bagby, Rogers, 
Buis y Kalcmba, 1994). Los estudios en los que 


se entrena a las personas para falscar el MMPI-2 
hacer surgir preocupaciones dticas perturba- 
doras (Ben-Porath, 1994; Wetter, Baer, Berry y 
Reynolds, 1994). 

Varias escalas clfnicas tienen una “correc- 
ciOn K" para mejorar su podcr de discrimi¬ 
naciOn. La fundamentaciOn para esta practica 
es que las elcvaciones de K indican una rcduc- 
ciOn artificial de las calificaciones en estas esca¬ 
las clfnicas. Por tanto. partes de la puntuaciOn 
natural de K se suman a las calificaciones en 
estas escalas clfnicas antes de calcular las pun¬ 
tuacioncs T. Las escalas con correcciOn K, que 
se analizan mds adelante, incluyen Hipo- 
condriasis, Desviacion psicopatica, Psicastenia, 
Esquizofrenia c Hipomanfa. El que en realidad 
la correcciOn K mejore al MMPI-2 es debati- 
ble, pero los editores de la prueba continua- 
ron la tradiciOn del MMPI en beneficio de la 
continuidad. Tambidn se encucntran dispo- 
nibles normas independientes para transfor- 
maciones de calificacioncs de escala sin co¬ 
rrecciOn K. 

Ademas de las escalas de validez, en el 
MMPI-2 siempre se califica para 10 escalas clf¬ 
nicas. Con exception de Introversion social, 
dichas escalas se construyeron a la manera co- 
mun de la codificaciOn de criterio al contrastar 
las respuestas de pacicntes clfnicos con las de 
controlcs normales. Como sc seriald antes. Intro¬ 
version social se desarrollO a travOs de contras- 
tar las respuestas de estudiantes universitarios 
con alta y baja introversion social. En el cua- 
dro 14—5 se resumen las 10 escalas clfnicas y 
las interpretaciones comunes para las califica¬ 
ciones elevadas. 

TambiOn pueden obtenerse calificaciones 
para doccnas de escalas complemcntarias en cl 
MMPI-2. Algunas de dstas se basan en la identi- 
ficaciOn racional de conjuntos de sfntomas y 
en la purificaciOn subsecucnle de las escalas a 
travOs de medias cmpfricos. De esta manera se 
desairollaron en el MMPI-2 15 interesantes Es¬ 
calas de contcnido (Butcher, Graham, Williams 
y Ben-Porath, 1990). Fueron investigadores in¬ 
dependientes quicncs dcsarrollaron muchas de 
las escalas complementarias; dstas varfan am- 
pliamente en cuanto a calidad. En la prOctica, 
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Cuadro 14-5. Las 10 escalas clinicas del Inventario multifasico 
de la personalidad de Minnesota-2 


Ntim. de escala 
y abreviatura 

Nombre de la escala 

Correccibn K 

Interpretacion tipica 
de la elevacibn 

1 

HI 

Hipocondriasis 

,5K 

Preocupacibn llsica excesiva 

2 

D 

Depresibn 


Sentimientos de tristeza, desesperanza 

3 

Hy 

Histeria 


Inmadurez. uso de represibn, negacibn 

4 

Dp 

Desviacion psicopbtlca 

.4K 

Conflictos con autoridad, impulslvidad 

5 

Ml 

Masculinidad-feminidad 


Intereses masculinos [mujeres], Intere- 
ses femeninos [varones] 

6 

Pa 

Paranoia 


Suspicacia, hostilidad 

7 

PI 

Psicastenia 

IK 

Ansiedad y pensamientos obsesivos 

8 

Es 

Esqulzolrenia 

IK 

Distanciamiento, procesos extranos de 
pensamiento 

9 

Ma 

Hipomania 

J2K 

Gran energla, posible agitacibn 

0 

Is 

Introversibn social 


Timldez e introversibn 


s6lo cerca dc 30 dc las escalas adicionalcs se 
califican de modo rutinario. Ejemplos dc las 
escalas complementary incluycn Ansicdad, 
Represibn, Fortaleza del yo y la Escala 
MacAndrew de alcoholismo-Revisada. Ansic¬ 
dad (A) y Represibn (R) son los primeros dos 
factores principales que siempre surgcn del 
andlisis factorial de las respuestas del MMPI-2. 
Una interesante escala complementaria es la 
Escala de Fortaleza del yo (Es) dc Barron, cu- 
ya prctensibn es anticipar la respuesta positiva 
a la psicoterapia. No obstante, no todos los cs- 
tudios confirman este uso dc la escala (Graham, 
1987). La Escala MacAndrew de alcoholismo 
-Rcvisada (MAC-R; MacAndrew, 1965) es un 
fndice util del abuso de alcohol y de otras sus- 
tancias. La MAC-R no sblo es eficaz cn la eva- 
luacibn del alcoholismo, sino que tambicn es 
util para identificar a bebedores extremos y a 
individuos con farmacodependencia (Wolf, 
Schubert, Patterson, Grande, Pendleton, 1990). 
En este caso es imposible revisar todas las 
escalas complementarias utiles. El lector inte- 
resado deberia consultar a Butcher y Williams 
(1992) y Graham (1993). 


INTERPRETAQ6N DEL MMPI-2 

La inlcrprctacibn dc un perfil del MMPI-2 puede 
seguir dos vfas diferentes: escala por escala o a 
travds de la configuraci6n. En el enfoque mds 
sencillo posible, aqudl de escala por escala, el 
examinador determina la validez de la prueba, 
como sc analiza antes, al inspcccionar las cua- 
tro escalas de validez. Si la prueba parece tener 
una validez razonablc segun cstos criterios, el 
examinador consulta un libro pertinente y pro- 
cede escala por escala para producir una seric 
de hipbtesis. Por ejemplo, Lachar (1974) ha 
obtenido el significado de diversas clevaciones 
en la escala Pa o Paranoia como siguc: 

T= 27 a 44, cl individuo examinado puede 
ser testarudo, irritable o diffcil. 

T -45 a 59 no existe sensibilidad indebida 
y hay una adecuada consideracion ha- 
cia los demis. 

T = 60 a 69 aumento de probabilidad dc 
rigidez y sensibilidad excesiva. 

7= 70 a 79 ngido. irritable, proyecta culpa 
y hostilidad. 
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T = 79 a 100 pueden estar presentes rasgos 
francamentc paranoides y dclirantcs. 

El enfoque de configuracidn para la interprcta- 
ci6n del MMP1-2 es un ianto mis complicado 
y consiste cn clasificar el perfil como pertene- 
ciente a una u otra clave de perfil definida de 
manera aproximada y quc se ha estudiado ex- 
tensamente. En general, las claves de perfil se 
definen por una combinacidn de elevacidn (dos 
o mis escalas clinicas clevadas por cncima de 
cierto criterio) y dcfinicidn (dos o mis csca- 
las clinicas que se destacan de manera clara de las 
dcmis). Por ejemplo, en su manifestacidn 
mis evidente, la clave de perfil 4-9 puede de- 
finirsc por un perfil vilido en el que la escala 4 
(Desviacidn psicopitica) y la escala 9 
(Hipomanfa) son las elevaciones mis altas, quc 
supcran ambas a una T de 65 (elcvacidn) y 
ambas exceden a la siguiente escala clinica mis 
alta en, cuando menos, 5 puntos de punluacidn 
^(definicidn). feta es la manera cn que Graham 
(1993) describe a las personas que encajan en 
esta clave de perfil: 

La caracteristica mas sotwesaliente de los indivi- 
duos 49/94 es un notable menospreclo hacia las 
normas y valores sociales. Con (recuencia tle- 
nen problemas con las autorldades debldo a su 
conducta antisocial. Tienen una conciencia poco 
desarrollada, moral dlsipada y valores ilicos cam- 
blantes. Entre las dificuttades en las que pueden 
verse Implicados se encuentra el alcoholismo, las 
pe'eas. problemas matrimonialos, acting out 
sexual y un amplio conjunto de actos delictivos. 
Esta es una clave de perfil comun entre perso¬ 
nas que abusan del alcohol y otras sustanclas. 

El diagndstico mis probable para dichos indivi- 
duos es el trastorno de personalldad antisocial. 

Se debe mencionar brevemente que se 
encuentran disponibles varios sistemas de in- 
terpretacidn por computadora para cl MM PI y 
cl MMPI-2 (Fowler, 1985; Butcher, 1987). El 
Minnesota Report ™ (Butcher, 1993) es el me- 
jor. Este sistema genera un informe muy cauto 
y metodico de 16 piginas que incluye el anili- 
sis de la validez del perfil, patrones sintomiti- 
cos, relaciones intcrpcrsonalcs, consideracioncs 
diagndsticas y de tratamiento. El Minnesota 
Report ™ tambiin proporciona una variedad de 


figuras y tablas para ilustrar los resultados de 
prueba. 

La calidad de los informes narrativos por 
computadora para cl MMPI-2 es generalmente 
buena, pero el lector deberfa percatarse de que 
son seres humanos faliblcs quicncs cscriben 
estos tipos de programas. Existe el peligro de 
que los informes de la prueba generados por 
computadora sean errdneos. Lo que es mis, 
por unos cuantos cientos de ddlares sc pueden 
comprar en disquetc de microcomputadora al- 
gunos sistemas de intcrprctacidn que son poco 
dignos de confianza. Esto aumenta el riesgo de 
que personas poco calificadas den un mal uso a 
las interpretaciones de la prueba por medio de 
computadora. En el capftulo final de esta obra 
se analizan las dificultades de la interpretacidn 
por computadora. 

PROPIEDADES TECNICAS DEL MMPI-2 

Dcsdc el punto de vista de los criterios psicomi- 
tricos tradicionales, el MMPI-2 presenta una 
imagen confusa. Los datos de confiabilidad son 
positivos en general, con coeficientes medianos 
de consistcncia interna (alfa) que por lo comun 
se colocan en los rangos de .70 y .80, pero que 
llegan a nivcles muy bajos, dentro del rangode 
.30, para algunas escalas en algunas mucstras. 
Los coeficientes test-retest a una semana van 
de la parte alta del rango de .50 a la parte baja del 
de .90, con una mediana dentro del rango de .80 
(Butcher, Dahlstrom, Graham, Tellegen y 
Kacmmcr, 1989). fetas son buenas cifras si se 
considera quc algunos atributos —como aqui- 
llos medidos con la escala de Depresidn— cam- 
bian con tal rapidez que la metodologfa 
test-relest tiene una idoneidad cuestionablc. 

Una de las principales deficicncias del 
MMPI-2 es que las intercorrelaciones entre las 
escalas clinicas son extremadamente altas. Por 
ejemplo, en cl caso de las escalas 7 y 8 (Psicaste- 
nia y Esquizofrenia), la correlaci6n se encuentra 
por lo comun cn cl rango de .70. En parte, esto 
refleja la superposici6n de los reactivos entre 
las escalas del MMPI —las escalas 7 y 8 com- 
parten 17 reactivos. Pero tambidn es cierto quc 
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el enfoque de codificacidn de critcrio no cs muy 
adccuado para cl dcsarrollo de medidas inde¬ 
pendences. Una alia intercorrelacidn de las cs- 
calas basicas cs uno de los precios a pagar por 
utilizar esta estrategia de desarrollo de prucbas. 

La validez del MMPI-2 es diffcil de resumir, 
debido al enorme volumen de investigacidn 
sobre este instrumento y su anteccsor, el MMPI. 
Para 197S se habfan llevado a cabo mas de 6 000 
estudios con el MMPI (Dahlstrom, Welsh y 
Dahlstrom, 1975). Porsupuesto, miles deestu- 
dios adicionales se han publicado desde cnlon- 
ces. Graham (1993) proporciona una breve pero 
intcresanlc resena de los estudios de validez 
sobre cl MMP1/MMPI-2. Eslc autor schala que 
los coencienles promedio de validez para los 
estudios sobre cl MMPI entre 1970 y 1981 era 
un saludable .46. Tambidn destaca el patron de 
confirmacidn que constituycn los corrclatos 
extemos a la prueba en docenas de estudios de 
grupos idcntificados de pacientes. Por ultimo, 
la invcstigacidn indica que el MMPI-2 es muy 
comparable al MMPI, para cl cual se ha reco- 
pilado un cucrpo sustancial de datos de validez 
(Hargrave, Hiatt, Ogard y Karr, 1994; Harrell, 
Honaker y Parnell, 1992). Por ultimo, los estu¬ 
dios sobre sesgo que comparan los resultados 
en el MMPI-2 de clientes caucasicos y afroesta- 
dounidenses indican que existen ligeras dife- 
rcncias racialcs en los perfiles promedio. No 
obstante, estas diferencias reflejan de manera 
vdlida el funcionamicnto cmocional; es decir, 
el MMPI-2 no tiene un sesgo racial (McNulty, 
Graham, Ben-Porath y Stein, 1997). 

Se ha mostrado que el MMPI y el MMPI-2 
son valiosos para una ampiia gama dc proble- 
mas diagndsticos, incluyendo la evaluacidn de 
los trastomos antisociales, limftrofes y narcisis- 
tas dc la personalidad (Castlebury, Hilsentoth, 
Handler y Durham, 1997), la valoraci6n de los 
antecedentcs de abuso sexual y la orientacidn 
sexual en mujeres (Griffith, Myers. Cusick y 
Tankersley, 1997), la predicci6n del resultado 
de cirugla para lumbalgia (Uomoto, Turner y 
Herron, 1988) y la clasificacidn empfrica dc 
personas acusadas de homicidio (Kalichman, 
1988), por citar s6lo unos cuantos cjemplos. Es 
probable que durante muchos aiios por venir el 
MMPI-2 conserve su cstatus como cl principal 


instrumento para la cvaluacidn de la psicopa- 
tologfa en la adultez. 

INVENTARIO PSICOLOGICO 
DE CAUFORNIA (CPI) 

Publicado originalmcntc en 1957, el CPI es un 
instrumento similar al MMPI que se revis6 dc 
manera recicntc y se disend de modo expreso 
para medir las dimensiones de la personalidad 
normal (Gough, 1987; McAllister, 1986), La 
prueba consiste de 462 reactivos de cierto/fal- 
so, incluyendo cerca dc 200 que sc tomaron 
prestados en forma directa del MMPI. El CPI 
rcvisado produce calificacioncs en 20 escalas que 
incluyen tres medidas disenadas para evaluar 
la actitud al responder la prueba. Estas escalas de 
validez son Sentido de bienestar (Sb), obtenida 
dc personas normales a quicnes se pidi6 que se 
“Fingieran malos"; Buena impresidn (Bi), ex- 
trafda dc personas normales a quicnes sc pidi6 
que se “fingieran buenos”; y Aspcctos comunes 
(Cm), que consiste dc los reactivos refrendados 
por 95% dc los individuos normales. As(, Sb, 
Bi y Cm estiin disenadas, respectivamente, para 
dctcctar a los individuos que se fingen malos, 
buenos o rcsponden de manera alcatoria. 

Las escalas clfnicas se basan en conccptos 
"populares" acerca dc la personalidad; miden 
dimensiones de dsta que son significativas y 
facilmcnte reconocibles para legos y psicdlo- 
gos por igual. Para 13 dc las 17 escalas clfni¬ 
cas, Gough utilizes un enfoque de codificacidn 
de criterio para el desarrollo de la prueba. Se 
formaron grupos extremos de participantcs 
(principalmcntc estudiantes uni versitarios) segun 
criterios relacionados con la escala como cali- 
ficacioncs cscolares, sociabilidad y participated!) 
en acti vidadcs extracurriculares. Despuds se con- 
trastaron las frecucncias dc confirmacidn de los 
reactivos para revelar las mejores afirmaciones 
para cada escala. Las cuatro escalas restantes se 
construyeron sobre una base racional respal- 
dada por indices de consistencia interna. Las 
escalas CPI se dcscribcn en el cuadro 14-6. 

Como reflcjo del cuidado con el que se cons¬ 
truyeron las escalas, los datos de confiabilidad 
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Cuadro 14-6. Descrlpcldn breve de las Escalas del 
Inventario psicologico de California 


Do 

Dominancia 

Dominante, persistente, buena capacidad de liderazgo 

Ce 

Capacidad de eslatus 

Cualidades personates que subyacen y conducen al estatus 

Sb 

Sociabilidad 

Temperamento comunicativo, sociable, participativo 

Ps 

Presencia social 

Aplomo, espontaneidad y confianza en sf mismo en situa- 
ciones sociales 

Aa 

Autoaceptacidn 

Autoaceptacidn y sentido de valla personal 

In 

Independencia 

Fuerte sentido de Independencia personal, no se le influye 
con facilidad 

Sb 

Sentido de bienestar 

No se preocupa o se queja, libre de dudas sobre s( mismo 

Em 

Empatfa 

Buena capacidad para empatizar con otras personas 

Re 

Responsabilidad 

Escrupuloso, responsable y conliable 

So 

Socialization 

Fuerte madurez social y elevada integridad 

Cm 

Autocontrol 

Buen autocontrol, libertad de la Impulsividad y del egocen- 
trismo 

To 

Tolerancia 

Permisivo. aceptante y poco critico de las creencias sociales 

Bi 

Buena impresidn 

Preocupado por crear una buena impresidn 

Ac 

Aspectos comunes 

Patron de respuesta vOlida y cuidadosa 

Lc 

Logro a travds de conformldad 

Buenos logros en ambientes donde es necesaria la confor- 
midad 

LI 

Logro a traves de independencia 

Buenos logros en ambientes donde es necesaria la inde¬ 
pendencia 

Ei 

Eliciencia intelectual 

Alto grado de eliciencia personal e intelectual 

Cp 

ComprensiOn psicoldgica 

Interesado en las necesidades intemas, motivos y expe¬ 
riences de otros, adcmas de responder a ellas 

Fx 

Flexibilidad 

Flexible y adaptable en pensamiento y conducts social 

Fe 

Feminidad 

Alto grado de intereses femeninos 


Fuenla: Basado on Gougti. H. Q. (1987). California Psychological Inventory manual Palo Aflo. CA Consulting Psychologists Press 
Tambten on Megargee, E, (1972) The CaMomia Psychological Inventory handbook. San Francisco Jossey-Bass 


para el CPI son bastantc satisfactorios. La ma¬ 
yor parte de las correlaciones test-retest entrc 
escalas se encuentran en el nivel de .80 a .90, 
con un rango de aproximadamcnte los .50 has- 
ta la parte baja de la zona de los .90, dcpcn- 
diendo de la mucstra y del intervalo entre 
aplicaciones. El CPI tambidn tiene una buena 
estandarizacidn; las calificaciones sc basan en 
una muestra normativa de 6 000 varones y 7 000 
mujeres de edades, clases sociales y regioncs 
gcogrdficas muy variadas. Todas las puntuacio- 
nes escalares se prcscntan como puntuaciones 
T, con una media de 50 y una desviacidn 
estdndar de 10. 


Las escalas CPI se somctieron a una vali- 
dacidn cruzada para dctcrminar su capacidad 
para discriminar a nuevas mucstras de indivi- 
duos calificados en la dimensidn pertincnlc. 
Estos coeficicntes de validez son bastantc con- 
fusos: algunos valores son accptables, pero otras 
correlaciones de criterio son muy bajas. Por 
ejemplo, cs comun quc las calificaciones en la 
cscala de Flexibilidad se correlacionen sdlo en 
cerca de .2 con las calificaciones de flexibili- 
dad de parte del personal (Domino, 1987). 

El CPI es heredero de una larga historia de 
investigation empfrica que corrobora varios 
correlatos rcalcs para perfilcs distintivos de la 
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prueba. Debido a las limitaciones de espacio, 
s6lo se pueden enumcrar varias ireas destaca- 
das en las que se ha confirmado de mancra em- 
pfrica el valor de la prueba. El CPI es util como 
auxiliar para predecir lo siguiente: 

• Rendimiento en preparatoria y univcrsidad. 

• Efectividad de cstudiantes-maestros. 

• Promedio general de califtcaciones en facui- 
tades de medicina. 

• Eficacia del personal policiaco y militar. 

• Liderazgo y exito ejecutivo. 

El CPI tienc particular efectividad para idcnti- 
ftcar adolescentes o adultos con una vida de 
delincuencia o criminalidad (Gough y Bradley, 
1992b). El lector puede cncontrar mayores de- 
talles sobre los corrclatos empfricos objetivos 
de los perl lies del CPI cn Groth-Mamat (1990) 
y Hargrave y Hiatt (1989). 

INVENTARIO MULTI AXIAL CLINICO 
DE MILLON-III (MCMI-llt) 

El MCMI-I1I es un inventario de la pcrsonali- 
dad diserfado para los mismos propositus que 
el MMPI-2; es decir, para proporcionar infor- 


macidn util para el diagndstico psiquiatrico 
(Millon, 1983, 1987, 1994). El MCMI-III tienc 
cuando mcnos dos ventajas sobre cl MMPI-2: 
primero es mucho mis corto (175 reactivos de 
cierto-falso) y, por tanto, es mis aceptable para 
las canalizaciones clfnicas; segundo, esti pla- 
neado y organizado para identificar patrones 
clfnicos de una manera que es compatible con 
el Manual diagndstico y estadfstico (DSM-IV) 
de la American Psychiatric Association. 

El MCMI-III es una prueba con bases te6- 
ricas muy fuertes, al incorporar la elaborada for- 
mu lac ion tedrica de Millon sobre la naturaleza 
de la psicopatologfa y de los trastomos de per- 
sonalidad (Millon, 1969, 1981, 1986;Millony 
Davis, 1996). La prueba incluye 27 escalas que 
se listan cn el cuadro 14-7. Las primeras II 
miden estilos o rasgos de pcrsonalidad como el 
narcisismo y las tendcncias anlisocialcs; las si- 
guientes ties evaluan una patologfa mis grave 
de la personalidad (trastomos esquizotfpico, li- 
mftrofe y paranoide); las siguientes siete esca¬ 
las evaluan sfndromes clfnicos como ansiedad 
y depresidn; las siguientes ires escalas evaluan 
sfndromes clfnicos mis graves como Uastomos 
del pensamiento; y las ultimas tres son fndices 
de validez (estilo de respuesta). Las calificacio- 
nes en estas escalas (Divulgacidn, Deseabilidad 


Cuadro 14-7. Escalas del Inventario Multlaxial Clfnico de Millon—III 


Patrones clfnicos de personalidad 

1 Esquizoide 

2A Evitante 

28 Depresivo 

3 Dependiente 

4 Htstrionico 

5 Narcisista 

6A Antisocial 

6B Agresivo (Sidico) 

7 Compulsivo 

8A Pasivo-Agresivo (Negativista) 

88 Autoderrotante 

Patologfa grave de la personalidad 

S Esquizotfpico 

C Limltrofe 

P Paranoide 


Sfndromes clfnicos 
A Ansiedad 

H Somatoforme 

N Bipolar Maniaco 

D Distimia 

B Dependence del alcohol 

R Trastomo por estres postraumitico 

Sfndromes graves 

SS Trastorno del pensamiento 

CC Depresidn mayor 

PP Trastomo delirante 

Indices de validez (Modificadores) 

X Divulgacion 

V Deseabilidad 

Z Degradacidn 
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y Degrudaci6n), se utilizan para ajustar las otras 
puntuaciones de escala hacia arriba o hacia aba- 
jo, con base en la defensividad o exageracidn 
de los sfntomas, respectivamente. 

El desarrollo de la escala para MCMI-III y 
sus precursores fue cuidadoso y mctddico. En 
este caso s6lo se puede describir un bosquejo 
amplio de este proceso, donde se selecciona- 
ron 175 afirmaciones de 3 500 reactivos origi- 
nales durante ires etapas de desarrollo de la 
prueba: una etapa tdorica-dc sustcntacidn (re- 
daccidn de reactivos con base en la tcorfa), una 
etapa interna-estructural (corrclacioncs reac- 
tivo-escala) y una etapa de critcrio cxtemo (con- 
trastacidn de grupos diagndsticos con el grupo 
de referenda). Una caracterfstica especial de 
la ultima etapa fue que Millon empleo como 
grupo de referencia a pacientes psiquiilricos en 
general, mis que controles normales. El pro- 
pdsito de esta estrategia era aumcntar la capa- 
cidad de lasescalas del MCM1 para diferenciar 
entre si a los grupos diagndsticos especiTicos. 
Por desgracia, un efccto sccundario de este cn- 
foquc particular de codificacidn de critcrio fue 
un grado bastante sustancial de superposicidn 
de reactivos en las escalas clfnicas. Millon ha- 
bfa planeado y esperado la superposicidn de 
reactivos, pero es probable que no haya antici- 
pado que algunos pares de escalas en el MCMI 
compartirfan la mayorfa de sus reactivos en co- 
mun. El posterior refmamiento de la escala en 
la segunda y tercera cdiciones elimin6 parte de 
esta superposicidn. El instrumento revisado 
tambidn incorpora un procedimiento de pon- 
dcracidn de reactivos. En este enfoque, las pre- 
guntas individualcs recibicron una pondcracidn 
de 2 o 1 para reflejar su importancia en la dis- 
criminacidn del prototipo de cada escala. El 
enfoque de ponderacidn de reactivos ha recibi- 
do la crftica de ser innecesario y poco flexible 
(Streiner, Goldberg y Miller, 1993). 

La muestra normativa del MCMI-III con¬ 
sists de cerca de 1 000 varones y mujeres pa¬ 
cientes, en todo EUA. Este es un enfoque poco 
comun y poldmico para la obtencidn de una 
muestra normativa. Es mis tfpico que se utilice 
el muestreo proporcionado de la poblacidn dc 
individuos razonablemente normales. Millon 


ofrecc la discutiblc justificacidn dc que una 
muestra de pacientes es adecuada como mues¬ 
tra normativa debido a que se consultaron las 
tasas base (en la poblacidn general) de traslor- 
nos especfficos, clfnicos y de personalidad, para 
calibrar las puntuaciones de corte en las esca¬ 
las individuales (Millon y Davis, 1996). Pero 
este enfoque es complejo, experimental y di- 
ffcil de comprendcr. La confiabilidad dc las 
escalas individuales es bastante buena: los co- 
eficicntcs dc consistcncia interna promedian de 
.82 a .90 y los coeficienles test-retest para una 
semana van de .81 a .87. La sustentacidn para 
la validez del MCMI-III es confusa (Haladyna, 
1992; Piersma y Bocs, 1997). 

Es poco probable que el MCMI-III reem¬ 
place al MMPI-2, que es mis adecuado para el 
diagn6stico de sfndromes clfnicos agudos. Sin 
embargo, el MCMI-III resulta prometedor para 
el diagndstico de trastomos de personalidad y, 
por tanto, puede complementar en este sentido 
al MMPI-2 (Antoni, 1993). No obstante, va- 
rios estudios independientes actuates han puesto 
cn duda el valor del MCMI-III y en especial de 
sus precursores en la determinaci6n de diagnds- 
ticos dentro del esquema del Manual Diag- 
ndstico y Estadfstico de los Trastornos Mentales 
(Smith, Carroll y Fuller, 1988; Patrick, 1988; 
McCann y Suess, 1988). Tambidn, Choca, 
Shanley, Peterson y van Denburg (1990) en- 
contraron evidencia de sesgo racial contra los 
afroestadounidenses en el MCMI. Reynolds 
(1992) capta lo que debe ser la opinion com- 
partida de muchos clfnicos cuando describe al 
MCM como “una joya conceptual que a nivel 
psicometrico se encuentra entre una pesadilla 
y un enigma”. Para otras crfticas. vdansc Dana y 
Cantrell (1988), y Overholser (1990). Craig 
(1993) ha conjuntado una serie de artfculos que 
cn su mayor parte apoyan al MCMI. 


INVENTARIO DE PERSONALIDAD 
PARA NINOS 

El Personality Inventory for Children ; PIC (In- 
ventario de Personalidad para Ninos) utiliza el 
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cnfoquc mctodol6gico general incorporado cn 
el MMPI y se disend para proporcionar des- 
cripciones clfnicas pertinenles de la conducta 
infantil y de las caracten'sticas familiares (l^achar, 
1982; Wirt y Lachar, 1981; Wirt, Lachar, 
Klincdinst y Scat, 1984). El PIC puede aplicarse 
a nifios y adolcscentes entre los 3 y 16 aiios de 
edad. En su forma original, el instrumento con- 
sistfa de 600 afirmacioncs de cierto-falso que 
respondc uno de los padres o la persona cncar- 
gada del cuidado del nino. Las preguntas sc 
parcccn a las siguientes: 

A mi hijo le resulta diffcil quedarse dormi- 
do. 

Mi hijo es melindroso para comer. 

Mi hijo ha amcnazado con matarsc. 

En ocasioncs mi hijo insulta a olios adultos. 

Nucstro matrimonio ha sido muy agitado. 

La prueba tambidn cstd disponible en tres ver- 
sioncs mis cortas (131, 280 y 420 reachvos). 
Las cuatro versiones de la prueba difiercn en 
cuanto al numero de esealas que pueden califi- 
carse. La versidn completa con 600 rcactivos 
produce cuatro esealas factoriales, cuatro esea¬ 
las de validez, 12 esealas clfnicas y 17 esealas 
experimentales. Las versiones de 280 y 420 
rcactivos no proporcionan calificaciones para 
las esealas experimentales, mientras que la ver- 
si6n de 131 reactivos. util principalmcntc con 
propisitos de dctcccidn, produce s61o cuatro 
puntuacioncs factoriales y un s6lo fndice de 
validez. En estc caso se limitari el anilisis a la 
versidn con 420 reactivos. 

Las esealas del PIC se dctallan en el cua- 
dro 14-8. Como ocurre con cl MMPI, las pun¬ 
tuacioncs naturales por escala se convierten en 
puntuaciones T con media de 50 y desviacion 
cstindar de 10. Las puntuaciones T clevadas 
aumentan la probabilidad de psicopatologfa o 
deficit. Las normas para nifios de 6 a 16 ahos 
sc basaron en una muestra de 2 390 nifios y 
adolcscentes que se obtuvo principalmentc del 
sistema cscolar cn Minneapolis. Estos indivi- 
duos provenfan de antecedentes de clase social 
muy variados y proporcionaron una base razo- 
nable para la gencralizacidn de los rcsultados 
de la prueba. Las normas para nifios prcescola- 


Cuadro 14-8. Esealas del Inventario 
de personalidad para nifios 

Esealas factoriales 
Indisciplinado/autocontrol deficienle 
Incompotencia social 
Intemalizaridn/Sintomas somiticos 
Desarrollo cognitivo 

Esealas de validez y deteccion 

Mentira 

Frecuencia 

Delensividad 

Adaptaddn 

Esealas clfnicas 
Logro 

Deteccion intelectual 
Desarrollo 

Preocupacidn somatica 
Depresidn 

Relaclones familiares 

Delincuencia 

Retraimiento 

Ansiedad 

Psicosis 

Hiperactividad 

Habilidades sociales 


res, entre 3 y 5 afios de edad, son mucho mds 
limitadas (102 varones y 90 ninas) y la prueba 
deberfa utilizarse con prccaucidn en este ran- 
go de cdadcs. 

Con la posible excepcidn de las esealas de 
validez, los nombres de las esealas se explican 
por sf solos. Las esealas de validez incluyen 
Mentira, una escala de 15 reactivos disenada 
para identificar a padres/encargados que son 
inocentemente defensives acerca del nino; Fre¬ 
cuencia, una escala de 42 reactivos disenada para 
identificar la exagcracidn deliberada acerca de 
los sfntomas o las respuestas aleatorias; Dc- 
fensividad, una escala de 23 reactivos que se 
emplea para identificar defensividad acerca de 
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I os problemas del nino; y Adaptaci6n, una cs- 
cala de 42 rcactivos que proporciona un fndice 
general de adaplacidn psicoldgica deficiente. 

La mayor parte de las escalas del PIC sc 
construyeron por medio de una variacidn esta- 
dfsticamcnte compieja del cnfoquc dc codifi- 
cacidn de criterio cmpfrico (Darlington, 1964; 
Darlington y Bishop, 1966). Este procedimienlo 
de iteracidn anade los posibles reactivos de la 
escala segun su correlation con el criterio per- 
tinente (p. ej., delincucncia, psicosis, disfuncion 
cerebral) y tambidn considera las corrclacioncs 
entrc reactivos para clcgir la combination dc cs- 
tos quc produzca la correlacidn mds alta cn- 
tre la calificacidn de la escala y el criterio. Qcho 
de las escalas de perfil se construyeron a tra- 
vds dc un mOtodo puramcntc racional basado 
en la nominacidn de reactivos dc parte de ex- 
pertos. listas fueron: Mentira, Dcsarrollo, Pre- 
ocupacidn somdtica, DcprcsiOn, Relaciones 
familiares, Retraimiento, Ansicdad y Habilida- 
des sociales. 

La confiabilidad de las puntuaciones esca- 
lares del PIC cs cxcepcionalmcntc bucna, con 
coeficientes test-retest cuyo promedio sc cncuen- 
tra en la parte alta del rango de .80 para trcs 
muestras difcrcntes (Wirt, Lachar, Klinedinst y 
Seat, 1984). Una monograffa indcpendiente de 
Lachar y Gdowski (1979) presenta los rcsultados 
confirmatorios de un amplio estudio de validcz 
quc sc utilizd para establccer interpretaciones 
dcscriptivas dc las calificaciones clevadas en 
las escalas del PIC. El estudio corrclacionO los 
resultados de la prueba de 431 clicntcs dc 
oricntacidn infantil con los datos de criterio 
quc proporcionaron padres, macstros y residen- 
tcs psiqui&tricos. Con base en cstas conclusio- 
nes, se confirmaron varias interpretaciones 
dcscriptivas para las calificaciones elevadas en 
el PIC. El estudio dc Lachar y Gdowski (1979) 
tambidn sirvid de fmpetu para el desarTollo dc 
un informe narrativo por computadora, dis- 

IKresumen 


ponible por correo si se solicita a los editores 
del PIC. Se cncuentra al alcance una vetsidn del 
programa para microcomputadora. Este apli- 
ca, califica e interpreta el PIC. Scgundos des¬ 
puds de que se lermina la prueba, cl programa 
imprime un amplio resurnen dc los datos y un 
informe narrativo extenso. 

Aunquc cl PIC tiene antecedentes quc da- 
tan del decenio de 1950 (Wirt y Brocn, 1958), 
el instrumento no atrajo la atencidn dc los inves- 
tigadores con orientaci6n empfrica sino hasta 
hace muy poco. En consccuencia, la investi¬ 
gation sobre la validez del PIC en realidad se 
encuentra en su infancia. No obstante, las 
conclusioncs contempordncas son bastante 
alcntadoras. Por ejemplo, Keenan y Lachar 
(1988) probaron la eficacia del PIC en la iden¬ 
tification dc nihos prccscolares que necesitan 
servicios de educaciOn especial. Al utilizar una 
regia de decision muy sencilla (dos o mds esca¬ 
las elevadas por arriba de T = 70), se clasificO 
de manera correcta a 91 % dc una muestra com- 
binada, clinica y no clfnica, dc 120 nihos. El 
PIC lambidn es muy eficaz para idcntilicar a 
nihos dc primaria con neccsidadcs educativas 
cspccialcs (Kline, Lachar y Boersma, 1993; 
Kline. Lachar. Gruber y Boersma, 1994). 
Lachar, Kline y Gdowski (1987) investigaron 
la precision de los resultados del PIC en fun- 
cion dc la psicopatologfa matema. Contrario a 
las expcctativas de sentido comun, las madres 
con peifiles clfnicamentc elevados en el MMPI 
tuvieron la misma precisidn en la descripcidn 
de sus hijos que aquellas con perfiles normalcs 
en el MMPI. Un problcma del PIC cs quc el en- 
foque de clave de perfil —tan cxitoso con el 
MMPI— ha resultado estdril en su caso (Kline, 
Lachar y Gdowski, 1992). Sin embargo, cl PIC 
conlinua siendo un instrumento titil cuando se 
interpreta escala por escala. Para revisioncs 
adicionales vdanse, Kline y Lachar (1992) y 
Rothermel y Lovell (1985). 


1. Los inventarios de autoinforme basados en 
la teoria dependen para su dcsarrollo de teo- 


rfas explfcitas dc la personalidad. Un buen 
ejemplo de un inventario guiado por la teo- 
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rfa es cl Edwards Personal Preference 
Shedule (EPPS), un instrument!) de 210 
reactivos de elecciAn forzosa que intenta 
medir las neccsidadcs manificstas de Murray 
a travAs de un autoinformc. 

2. La Personality Research Form de Jackson 
(PRF) lambiAn sc basA en el sistema de ne- 
cesidades de Murray. Las 20 escalas dc per- 
sonalidad en la PRF no tienen superposiciAn 
de reactivos y muestran una consistencia in¬ 
terna excepcional (mediana dc .92). La va¬ 
lidez dc la PRF se fundamenta en andlisis 
factoriales confirmalorios y en corrclacio- 
ncs apropiadas con escalas similares en 
otros inslrumentos. 

3. El Inventario TipolAgico dc Mycrs-Briggs 
(MBTT) es un inventario de autoinforme dc 
elecciAn forzosa que sc basa de manera 
aproximada en la teorfa de tipos de pcrsonali- 
dad de Carl Jung. En cl MBTI se califican 
cuatro dimensioncs: ExtravcrsiAn-Intro- 
versiAn, ScnsaciAn-IntuiciAn, Pensamicn- 
to-Scntimiento y Juicio-PercepciAn, locual 
produce 16 tipos diferentes: como el 
ENSP. 

4. El Jenkins Activity Survey (J AS) es un cues- 
tionario dc opciAn multiple con 52 rcacti- 
vos, disenado para identificar el patrAn 
conductual Tipo A, con propensiAn a la 
cardiopatfa. Las tres subescalas incluyen: 
Velocidad e impaciencia. Participation la- 
boral y Dinamismo y Competitividad. El 
JAS ticne varias limitaciones (p. cj., nor- 
mas poco representativas, complejidades en 
la calificaciAn) y, por tanto, es mds ade- 
cuado para invesligaciAn. 

5. Una prueba corta y sencilla que ha recibido 
alias calificaciones debido a su merito tec- 
nico es el Inventario dc ansiedad: rasgo-es- 
tado (IDARE). Los 40 reactivos de esta 
prueba se califican cada uno en una escala 
de intensidad dc cuatro puntos. El IDARE 
midc ansiedad estado, o sentimientos tran- 
sitorios dc temor o preocupaciAn; y ansie¬ 
dad rasgo, la tendencia relativamente 
establc a responder de manera ansiosa ante 
situaciones estresantes. 


6. El Cuestionario de 16 factores de la perso- 
nalidad de Cattell (16FP) es ti'pico de los 
inslrumentos derivados del andlisis facto¬ 
rial. Las cinco formas del 16FP (para gru- 
pos de diferentes edades) engloban todas 
un formato dc elecciAn forzosa. Los dieci- 
seis atributos de personalidad examinados 
(y cuatro dimensiones de orden superior) 
sc han confirmado de manera repetida a (ra¬ 
ves del andlisis factorial. 

7. El Cuestionario dc personalidad de Eysenck 
(EPQ) propone tres dimensiones principa- 
les de la personalidad, derivadas de manera 
analftico-factorial; Psicoticismo, Extraver- 
siAn y Neuroticismo. Las confiabilidades de 
escala son bastante fuertes y la validez 
de constructo del instrumento ha recibido 
apoyo dc docenas de estudios. 

8. Las Conrey Personality Scales (CPS) cons- 
tituyen un instrumento corto dc autoinformc 
adecuado para cstudiantes universitarios. 
Las ocho escalas CPS consisten de 20 rcac- 
ti vos cada una y no tienen superposiciAn. Las 
escalas muestran excelente consistencia in¬ 
terna. Las calificaciones extremas son ade- 
cuadas en especial para predecir trastomos 
psicolAgicos. 

9. El Inventario NEO de personalidad-Revisa- 
do (NEO PI-R) se basa en el modclo dc 
cinco factores de la personalidad que sc des¬ 
cribe antcriormcntc. Los cinco constructos 
que mide la prueba son Neuroticismo, Ex- 
traversiAn, Apertura a la experiencia, Con- 
formidad y Escrupulosidud. El NEO PI-R 
cstS disponiblc en dos formas paralelas que 
consisten dc 240 reactivos calificados en 
una dimensiAn de cinco puntos. 

10. El MMPI-2 consiste de 567 preguntas de 
cicrto-falso. En la prueba se califican cua- 
tro escalas de validez (?, L, F y K) que eva- 
luan, respectivamente, las preguntas no 
respondidas. defensividad inocente, res- 
puestas desviadas y defensividad sutil. Las 
10 escalas clfnicas son Hipocondriasis, 
DepresiAn, Histeria, DesviaciAn psicopi- 
tica, Masculinidad-feminidad, Paranoia, 
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Psicastenia, Esquizofrenia, Hipomanfa e 
Introversidn social. 

11. El Inventario psicologico de California (CPI) 
es un instrumento parecido al MMP1 que 
se disefid para mcdir las dimensioncs de la 
personalidad normal. Tres escalas midcn 
las actitudes al responder prueba (p. ej., 
las (endencias a “Fingirse bucno” y “fingir- 
se malo"). Las 17 escalas ch'nicas se basan 
cn conccptos “populares” de la personali¬ 
dad que reconocen facilmente los legos. 

12. El Inventario multiaxial clfnico dc Millon, 
que ahora se cncuentra en su tercera vcr- 
si6n (MCMI-III) es una prueba corta (175 
reactivos de cierto-falso) disefiada como 
auxiliar para el diagndstico psiquiiitrico. Las 
27 escalas clfnicas se organizaron en tres 


categorfas amplias relacionadas con el 
DSM-IV: patrones clfnicos de persona¬ 
lidad, patologfa grave dc la personalidad, 
sfndromes clfnicos y sfndromes clfnicos 
graves. 

13. El Personality Inventory for Children (PIC) 
se disenb para proporcionar descripciones 
clfnicamente apropiadas de la conducta in- 
fantil y de las caracterfsticas familiares. La 
forma mds comun consiste de 420 reactivos 
relacionados con el nino y la familia que res- 
pondc uno de los padres o la persona cn- 
cargada del cuidado del nino. Cuatro es¬ 
calas proporcionan datos de validez y 
detection. La mayor parte dc las 12 escalas 
clfnicas sc dcrivaron del enfoque dc codifica- 
cidn de criterio. 


igjTERMINOS Y CONCEPTOS CLAVE 


Scrie de respuestas de 


Ansicdad rasgo 

p. 623 

deseabilidad social 

p. 618 

Extraversi6n 

p. 627 

Prueba ipsativa 

p. 618 

Introversi6n 

p. 627 

Ansicdad estado 

p. 623 
































































Tema 14B 

Evaluacion conductual 
y enfoques relacionados 



EL este tema, el lector sc cnfrentard con 
una variedad de enfoques directos, innovadores 
y, cn ocasioncs, no tradicionales de la cvalua- 
cidn de la personalidad, que de manera colecti- 
va se conoccn como evaluacion conductual. 
feta sc conccntra en la conducta mds que en 
los rasgos subyaccntes, causas hipotdticas o 
supuestas dimensioncs de la personalidad. Los 
muchos mdtodos de c valuacidn conductual ofre 
cen una alternativa prdctica a las pruebas 
proyectivas, inventarios de autoinforme y otras 
tecnicas inmanejnbles dirigidas a la evaluacidn 
global de la personalidad. 


Por lo comun, la evaluacidn conductual estd 
disenada para satisfacer las ncccsidadcs de los 
(crapeutas y de sus clientes de manera rdpida y 
sin complicacioncs. Pcro este tipo de cvaluacidn 
difiere de la tradicional en mds aspcctos que su 
sencillcz. Las suposiciones bdsicas, aspectos 
prdclicos y metas csencialcs de las enfoques 
conductual y tradicional son tan diferentes en- 
tre sf como el dfa y la noche. Las estrategias 
tradicionales de evaluacidn tienden a scr com- 
plejas, indirectas. psicodindmicas y. con fre- 
cuencia, ajenas al tratamiento. En contraste, las 
estrategias conductuales tienden a ser sencillas. 
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directas, de andlisis de la conducta y continuas 
con respecto al (ratamicnto. 

Los (erapeutas conductualcs utilizan una 
amplia gama de modalidades para evaluar a sus 
clientes, pacientcs c individuos. Los mbtodos 
dc evaluacibn conductual incluyen, pero no se 
limitan a: observaciones conductualcs. auto¬ 
informes, calificacioncs de padres, personal, 
hermanos, jueces, maestros, terapeutas y 
enfermcras; evaluacibn fisiolbgica, bioqufmica 
y biolbgica; cntrcvistas estructuradas y scmi- 

Cuadro 14-9. Muestrario de pruebas 

Escala de movimienlos anormales involuntarios 
Evaluacibn de aclividades cotidianas-modulares 
Cuestionario de cogniciones agorafbbicas 
Escala de creencias alcohblicas 
Cuestionario de actividad antidepresiva 
Situaciones asertivas 

Prueba de autoafirmaciones de asertivldad 
Prueba de equiparacibn automatizada de (iguras 
familiares 

Escala de clasificacibn del perfil conductual 
Evaluacidn conductual del bruxismo 
Prueba de diapositiva de evitacidn conductual 
Medidas conductuales de depresidn grave 
Prueba conductual de agudeza visual 
Cuestionario de comilonas 
Nivel de alcohol en sangre 
Reactividad a la presidn sanguinea 
Cuestionario de sensaciones corporales 
Sistema de codificacidn de la resistencia del 
cliente 

Clasilicacion de demencia clinica 
Escala de exposicidn al combate 
Lista de verificacidn de actividad compulsiva 
Cuestionario de conducta conllictiva 
Diarlo del dormir cotidiano 
Inventario Derogatis de tuncionamiento sexual 
Inventario de tentaciones alimenticias de Dieter 
Escala de actiludes disfuncionaies 
Mediddn de monbxido de carbono en el aire 
espirado 

Sistema de codificacion de la interaccibn familiar 

Fuento: Basado en la lista de Hersen, M y BelUck. A S (eds) (IS 
Pergamon 


estructuradas, y pmebas andlogas. En su Dictio¬ 
nary of Behavioral Assessment Techniques, 
Hersen y Bcllack (1988) listan 286 pruebas 
conductualcs quc se cmplean en problcmas y 
trastomos muy divcrsos en ninos, adolescen- 
tes, adultos y poblacibn geridtrica. De modo 
que para que el lector pueda apreciar la divcrsi- 
dad de tbcnicas disponibles, se proporciona un 
muestrario de estas pruebas en el cuadro 14-9. 

La evaluacidn conductual es, con frecuen- 
cia, —pero no siempre— una parte integral dc la 

y tecnicas de evaluacidn conductual 

Escala de situaciones conductuales de urgencia 
en incendios 

Prueba de competencia mental del tribunal de 
Georgia-Revisada 
Escala de obtencibn de metas 
Prueba de evitacibn de altura 
Inventario de creencias irracionales 
Inventario Leyton de obsesiones 
Cuestionario McGill del dolor 
Prueba Michigan de deteccibn de alcohol 
Escala de autoafirmaciones de ansiedad en la eje- 
cucibn musical 

Cuestionario de crisis de angustia 
Sistema de codificaclbn de la interaccibn padres- 
adolescentes 

Respuestas de volumen del pene 
Prueba de sfntomas posteriores a la violacibn 
Escala de calificacibn de autocontrol 
Evaluacibn de autoafirmaciones a traves de lislado 
de pensamiento 

Escala de busqueda de sensaciones-Forma VI 
Escalas de experiencia sexual 
Lista de verificacibn de problemas verbales con el 
cbnyuge 

Caminata estandarizada 
Inventario de probabilidad subjetiva de coosecuencias 
Alimentos de prueba en la evaluacibn de bulimia 
nerviosa 

Inventario de valoracibn del tratamiento 
Entrevista estructurada para personalidad Tipo A 
Escala de analogia visual 

!8) Dictionary ot bahavioral assessment techniques NuevaYortc 
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terapia conductual, disenada para cambiar la 
duraci6n, frecuencia o intcnsidad de una con- 
ducta bianco bien dcfinida. Por cjemplo, una 
meta dc la terapia para una estudiante universi- 
laria tfmida podrfa ser que esta iniciara de ma- 
nera diaria un mfnimo de cinco conversacioncs 
quc duren dos minutos o mis. El tcrapcuta po¬ 
drfa recomcndar que la estudiante enfocara esta 
meta de manera aumentativa, comenzando con 
unos cuantos intcrcambios sociales breves an¬ 
tes de proceder a conversaciones mas extensas 
con personas desconocidas. En este cjemplo, 
la cvaluacidn conductual podrfa asumir la for¬ 
ma de un automonitorco cn cl quc la estudiante 
utilizara un crondmctro para tomar el tiempo y 
un diario para llevar un registro de las conver¬ 
sacioncs. 

Como se scnald, es frccuenle quc la cva- 
luacidn conductual estd al servicio de la tcra- 
pia conductual. En muchos casos, la naturaleza 
de la evaluacidn conductual esta en funcidn de 
los procedimientos y metas de este tipo de tera¬ 
pia. Por tal razdn, el lector podr£ apreciar mc- 
jor las herramientas de la evaluacidn de la 
conducta si se entrelaza este tema con un anali- 
sis dc los nidtodos de terapia conductual. 


g FUNDAMENTOS DE LA TERAPIA 
| CONDUCTUAL 


La terapia conductual, tambidn llamada modi- 
ficacidn de conducta, es la aplicacidn dc los 
mdtodos y conclusiones de la psicologfa expe¬ 
rimental a la modificacidn de la conducta desa- 
daptada (Plaud y Eifert, 1998). Las rafces de la 
terapia conductual pueden encontrarse cn 
Science and Human Behavior (1953), libro fun¬ 
damental de Skinner en el que se detalla la apli- 
cacidn del condicionamiento operante a los 
problemas de la conducta humana. Este autor 
rchuyd toda referenda a los acontecimientos 
privados, no observables, como pensamientos y 
sentimientos y en vez dc cllo enfatizd la impor¬ 
tance dc idcntificar las conductas observables y 
de alterar de manera metddica las consecuen- 
cias ambientalcs dc dichas conductas. 


La investigaci6n de Wolpe (1958) sobre cl 
tratamiento conductual sistemdtico dc las fobias 
tambidn tuvo influence en el establccimicnto 
de los mdtodos de terapia conductual. Los pro¬ 
cedimientos clfnicos de Wolpe se obluvieron 
de su trabajo de laboratorio sobre el condicio¬ 
namiento y contracondicionamiento del temor 
en los gatos. Como Skinner, Wolpe le resld dn- 
fasis a la importance dc los pensamientos y 
creencias. Este experimentador consideraba que 
el temor es un fendmeno aprendido que puede 
desaprenderse al seguir un estricto prolocolo 
de exposici6n por grados al objeto o situacion 
temidos. 

De manera mds reciente, Bandura (1977), 
Mahoney y Arnkoff (1978) y Meichenbaum 
(1977) reintrodujeron los fac tores cognitivos al 
siempre cambiante esquema conductual. Por 
ejemplo, Bandura (1977) demostrd que las per¬ 
sonas son absolutamente capaces de un aprendi- 
zajc con base cognitiva. En particular, este autor 
mostrd que los individuos pueden aprender de 
la mera observacidn dc las contingencias de res- 
pucsta experimentadas por modelos. Dado que 
este aprendizaje existe en auscncia dc conse- 
cucncias personales, debe tener una mediacidn 
cognitiva. Como consccuencia de este cambio 
de paradigma, casi todos los terapeutas conduc- 
Uiales de la actualidad se ocupan —al menos 
en cicrto grado— de los pensamientos y creen¬ 
cias de sus clientes. Este nuevo dnfasis se rcflcja 
en una familia de procedimientos de tratamiento 
muy populares conocidos dc manera colectiva 
como terapia cognitiva-conductual (McMullin, 
1986). 


$$ TERAPIA Y EVALUACI6N 
ft i CONDUCTUAL 

En la actualidad, las tdcnicas especfficas de te¬ 
rapia conductual pueden clasificarse en cinco 
categorfas superpuestas (Johnston, 1986): md- 
todos basados en la exposicidn, proccdimicnto 
de manejo dc contingencias, terapias cognitivas- 
conductuales, procedimientos dc autocontrol, 
y entrenamiento en asertividad y habilidadcs 
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sociales. La evaluacidn conduclual se utiliza en 
lodos cstos enfoques, como se rescfia en las 
siguientes sccciones. No obstante, existen re- 
lativamente pocas herramientas con base 
conductual para la valoracidn de habilidades 
sociales, de modo que csta categorfa no sc ana- 
liza. Los lectores que deseen una cobertura 
limitada de instrumentos para la valoracidn 
conductual del cntrcnamicnto en habilidades 
sociales (incluycndo asertividad) deberfan con- 
sultar a Meier y Hope (1998). 

METODOS BAS ADOS EN LA EXPOSICK^N 

Los mbtodos de terapia conductual basados en 
la exposicidn son muy adccuados para el trata- 
miento de fobias que incluyen temores inten- 
sos c irracionales (p. ej., a las aranas, sangre, 
hablar ante un publico). Un enfoque para la 
cvitacidn fdbica es la exposicidn sistemitica del 
cliente a la situacidn u objeto temidos. Wolpe 
(1973) favorecid la exposicidn gradual con un 
minimode ansiedad dentrode un proccdimicnto 
conocido como desensibilizacidn sistemdtica. 
En este enfoque tcrapbutico, el cliente aprende 
primero a relajarse totalmcntc y despuds pro- 
ccdc desde la cxposicidn imaginaria hasta la 
actual o en vivo al eslfmulo temido. Otro mdto- 
do basado en la exposicidn cs la inundacidn o 
implosion, en la que cl cliente se sumerge de 
manera inmediata y total dentro de la situacidn 
inductora de ansiedad. 

El tcrapeuta neccsita cierto tipo de evatua- 
cidn conductual para estimar el piogrcso continuo 
dc un cliente que atraviesa por un tratamien- 
to de las fobias basado en la exposicidn. En el 
enfoque de evaluacidn mbs sencillo posiblc, 
el cual sc conoce como Behavioral avoidance 
Test, BAT (Prueba dc Evitacidn Conductual; 
BAT), el terapeuta mide la cantidad de liempo 
que el cliente puede tolcrar al estfmulo que Ic 
induce ansiedad. A continuacidn se presenta un 
cltisico cjcmplo dc una BAT utilizada para eva- 
luar a pacientes con agorafobia, un temor 
incapacitantc a los espacios abiertos que con 
frecucncia se acompaha dc ataques de pdnico: 

La Behavioral avoidance Test (BAT) ©standari- 

zada se Ilev6 a cabo una somana despuds del 


ingreso. Se hablan rotirado lodos los medicamen- 
tos ansiolilicos. antidepresores y olios (irrnacos 
psicotropicos al monos cualro dias antes de la 
prueba. El primer autor fue quien apltco la prueba 
sin conocer los dlagndslicos de los pacientes 
(y) sin haber participado en el tratamiento. Se 
pldib a los pacientes que caminaran solos tan 
lejos como podieran del hospital, por un camino 
con trdnsito ligero cuya longitud era de dos kil<J- 
metros. La ruta estaba dlvldida en ocho interva- 
los de extensiones iguales y los pacientes califl- 
caron su ansiedad en una escala de 0 a 10 al 
(Inal de cada Intervalo. Los Intervales no condul- 
dos recibieron una calificacibn de 10. Se calculb 
una calrticacibn de evltactbn de la ansiedad al 
sumar las calilicactones de ansiedad de lodos 
los Interva los (Hoftarl, Frlis, Strand y Olsen, 1994). 

Los investigations descubrieron que la califi- 
cacidn dc evitacidn dc la ansiedad en la tdcnica 
BAT sc relacionaba en gran medidn con los 
autoinformes dc pensamientos catastrdficos 
(p. ej., asfixiarse hasta morir, tener un infarto, 
actuar de manera absurda, quedar desamparado). 
Esta conclusion ilustra que, con frecucncia, los 
enfoques de evaluacidn conductual abarcan 
tnmbicn un componcnte cognitivo. Tambibn de- 
be scnalarsc la rclacidn directa entre la meta de la 
terapia y la prueba de evitacidn conductual. En 
la agorafobia, la meta principal del tratamiento 
consiste en reducir la ansiedad de los pacien¬ 
tes al caminar por sf solos en espacios abiertos 
—que es exactamente lo que mide la BAT. 

El enfoque BAT sc basa en la suposicidn 
razonablc deque el temor del cliente cs cl princi¬ 
pal determinantc dc la conducta en la situacion 
dc prueba. Por desgracia, las caracterfsticas de 
la demanda de conducta dcseable pueden ejer- 
cer una fuerte influencia sobre la conducta del 
cliente. La tolerancia de £ste hacia el estfmulo 
inductor de ansiedad (endrf cierta relacidn con 
el temor experimentado, pero tambibn tienen 
mucho que ver con el contexto de la situacidn 
de evaluaci6n (McGlynn y Rose, 1998). Puede 
ser que no sc generalicen los rcsultados de las 
cvaluaciones BAT y el terapeuta debe tenercau- 
tcla de no concluir el tratamiento demasiado 
pronto. 

El Fear Survey Schedule (Inventario de 
Estudio del Temor) es otro tipo de evaluacidn 
conductual, util para la identificacidn y cuanti- 
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ficacidn dc los tcmorcs. Los Fear Survey 
Schedules son instrumentos con validez de Facie 
que requicren que los individuos que los res- 
pondcn indiqucn cn una cscala, por lo comun 
del tipo Likert de 5 a 7 puntos, la prcscncia c 
jntcnsidad dc sus tcmorcs en relacidn con di- 
versos cstfmulos. Se han publicado docenas de 
estos instrumentos, incluycndo vcrsioncs dc 
Wolpe (1973), Ollendick (1983) y Cautcla 
(1977). Tasto, Hickson y Rubin (1971) emplea- 
ron el aniilisis factorial para desarrollar un in- 
vcntario de 40 reactivos que produce un perfil 
dc calificaciones de temor en cinco catcgorfas. 
En el cuadro 14-10 se muestra un inventario 
generico dc cstudio del temor. Los Fear Survey 
Schedules sc utilizan con frecucncia en pro- 
yectos de investigacidn para estudiar grandes 
muestras dc personas en busca de aquellas que 
comparten un temor. Otro uso de estos inven- 
tarios consistc en registrar los cambios en te- 
mores, incluyendo aquellos que sc han hecho 
el bianco de la intervencidn clfnica. 

Klieger y Franklin (1993) han expuesto 
varias advertcncias acerca del uso dc los Fear 
Survey Schedules en la invcstigacidn clfnica. 


Estos autorcs scnalan que los datos de confia- 
bilidad para los cstudios del temor son casi 
inexistentes. Un problcma m£s grave tiene que 
vercon la validez de estos instrumentos. Al uti- 
lizar el Fear Survey Schedule-Ill (FSS-III) dc 
Wolpe y Lang (1977), un inventario sumamen- 
te respetado y de amplio uso, Klieger y Franklin 
(1993) no cncontraron rclacidn entre los temo- 
rcs presentados en cl FSS-III y medidas de BAT 
de los mismos lemores. Por ejemplo, los indi¬ 
viduos que informaban un fuerte temor a la 
sangre cn cl FSS-III estaban en la misma pro- 
babilidad de accrcarsc a una toalla blanca con 
sangre y tocarla que aquellos que no informa- 
ron temor a la sangre. Resultados similares se 
cncontraron en personas que temfan a serpien- 
tes, arahns y fuego. Los investigadores conclu- 
yeron que el FSS-III c instrumentos similares 
son una pobre eleccidn para identificar a grupos 
experimentales y constituyen una base limita- 
da para medir el resultado de las intervcnciones 
tcrapduticas. Su fracaso esencial parecc residir 
en que estos inventarios poseen una validez tan 
“obvia”, que pocos investigadores se han pre- 
ocupado cn evaluar las caractcrfsticas psicome- 


Cuadro 14-10. Ejemplos de un Inventario de estudlo del temor 


Por favor marque en la columna que describe mejor su respuesta actual a estas situaciones u objetos. 


Grado al que usled se sentirfa perturbado 


Eslar en un lugar desconocido 

Hablar en publico 

Entrar a una fiesta 

Poner una inyecckin 

Que las personas me mlren trabajar 

Grandes espacios abiertos 

Estar gordo 

Arana en la pared 

Galo en la habitacion 

Regano del jefe 


De ninguna 
manera 


S6lo un Cantidad 
poco moderada 


Exlremada- 
Mucho menle 
allerado 


Note: la mayor la de los inventarios de estudio del temor mduyen varias docenas de reactivos 
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tricas tradicionales dc confiabilidad y validez. 
Los Fear Survey Schedules deben utilizarsc con 
cuidado. 

PROCEDIMIENTOS DE MANEJO 
OE CONTINGENdAS 

El manejo de contingencias se basa en la su- 
posicidn dc quc toda conducta —incluyendo la 
conducta trastornada o dcsadaptada— sc con- 
serva en funcidn dc sus consccucncias. El enfo- 
que de manejo dc contingencias para el cambio 
conductual precede en dos pasos. En cl primero, 
el terapeuta intenta idcnlificar las consecuencias 
que refuerzan dc mancra positiva una conducta 
indeseablc. Por ejemplo, en el caso de un ama 
de casa con agorafobia, el terapeuta podrfa delcr- 
minar que ella recibe la atencidn de su familia 
primordialmentc cuando sufre panico y estfi 
encerrada en casa. En esta situacidn, la conduc¬ 
ta dcsadaptada de p£nico y encierro se mantie- 
nc—al menos en parte—debido a la inoportuna 
amabilidad dc los miembros de la familia. El 
paso dos consiste en cambiar las contingencias 
asociadas con la conducta indeseablc. El tcra- 
peuta podrfa recomcndar que los miembros de 
la familia no Ic presten atencidn al ama de casa 
durante sus episodios de pitnico y que refuercen 
sus pequenos pasos hacia la independencia. Por 
ejemplo, si la mujer camina al buzdn de correos 
y de regreso, los miembros de la familia debe- 
rfan dcmostrarle su atencidn. 

Una forma de manejo de contingencias que 
sc utiliza con amplitud en instituciones es la 
economfa de fichas. Este enfoque se adapta de 
manera particulamente adecuada a clientcs con 
repertorios conductuales limitados. En una eco- 
nomta de flehas, muchos tipos diferentes de 
conducta prosocial se recompcnsan a travds 
dc fichas que despuds pueden intercambiarse 
por recompensas materiales o privilegios 
(Kazdin, 1988). 

La evaluacidn conductual en una econo¬ 
mfa de fichas asume principalmente la forma 
de observacidn conductual dirccta (Foster, Bell- 
Dolan y Burge, 1988). La aplicacidn de un siste- 
ma de observation conductual directa cs mucho 


mils demandante de lo que parcce. El inves- 
tigador o terapeuta debe identificar las conductas 
bianco, definirlas dc manera prccisa, producir 
un sistema para cl registro dc datos, calibrarlas 
recompensas apropiadas y entrenar a los miem- 
bros del personal (Paul, 1986). Si el programa 
funciona, la frecuencia observada de conduc¬ 
tas presociales determinadas aumcntard dc modo 
gradual a lo largo de un periodo de meses o 
semanas. 

Las economfas de fichas fueron muy po- 
pulares en el dccenio de 1970, cuando se les 
empleaba incluso en sistemas cscolares com- 
plctos para facilitar la mejorfa en habilidades 
sociales de cstudiantes dc primaria que sufrfan 
desventajas (Bushcll, 1978). Las economfasde 
fichas siguen siendo populares, pero el entu- 
siasmo inicial acrftico se ha visto reemplazado 
por una perspectiva menos jovial. Kazdin (1988) 
analiza las limitaciones de las economfas de fi¬ 
chas. las cuales incluyen: 1) generalizaci6ndc- 
ficicntc de las conductas bianco mds alld del 
programa dc tratamicnlo, 2) dificultades para 
entrenar al personal para quc ponga en marcha 
dc manera adecuada las economfas de fichas y 
3) resistencia del cliente a la participation. 
Ademds, la reactividad puede ser un problema 
en la observaci6n conductual directa: es posi- 
ble que los clientes no se comporten de manera 
natural cuando saben que se les observa. 

TE RAP IAS COGNITIVAS-CONDUCTUAIES 

El factor comun a todos los tipos de terapia cog- 
nitiva-conductual es un Onfasis en cl cambio de 
la estructura de crcencins del cliente. Las tres 
variedades mas conocidas de terapia cognitiva- 
conductual son la terapia racional emotiva 
(TER) de Ellis (1962), el entrenamiento de auto- 
instruction dc Meichcnbaum (1976) y la tera¬ 
pia cognitiva de Beck (1976). Ellis postula quc 
la mayor parte de la conducta trastornada es cl 
producto de creencias irracionales, como la muy 
difundida creencia de que uno debe tener el 
amor y la aprobaciOn de todas las personas sig- 
nificativas en todo momento. Ellis intenta alte- 
rar dichas creencias irracionales centrales 
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principalmente a (raves de los argumcntos I6gi- 
cos y la exhortacidn eontundente. La tlcnica 
de autoinstruccidn dc Mcichenbaum consisle 
en ensenarlc al clicntc a utilizar autoafirmacio- 
nes dc cnfrcntamicnto para combatir las situa- 
ciones cslresantcs. Porcjemplo, a un estudiantc 
univcrsitario que sufre de una intensa ansicdad 
cuando presenta pruebas se le podrfa enschar a 
utilizar la siguiente platica interna durante los 
exdmcnes: “Esta vez tienes una estrategia... 
Respira profundamente y rel6jate... Tan s61o 
respondc a una prcgunta a la vez...”. La tcrapia 
cognitiva dc Beck seconccnlra dc mancra pri¬ 
mordial cn el papcl de las distorsioncs cogniti- 
vas en cl mantcnimicnto dc la deprcsidn y otros 
trastomos cmocionales. Beck (1983) considc- 
ra que la depresidn es, de manera fundamental, 
un trastorno cognitivo que se caracteriza por la 
trfada cognitiva negativa: una perspectiva pc- 
simista del mundo, un autoconceplo pesimista 
y un punto de vista pesimista acerca del futuro. 
En la terapia, Beck utiliza una forma cordial de 
reestructuracidn cognitiva para ayudar al clicntc 
a percibir sus problemas en tdrminos alternati¬ 
ves, que tengan una posible solucidn. 

Los terapeutas cognitivo-conductuales no 
necesitan utilizar herramientas formates de eva- 
luacidn cn su prdctica clfnica. Por lo cornun, 
estos terapeutas vigilan la estructura de creen- 
cias de sus clicntcs de manera informal de una 
sesidn a otra. Los pensamientos irracionales y 
distorsionados sc ponen cn duda a medida que 
surgen cn la terapia. Al final, el autoinformc de 
mejorfa de parte del cliente puede constituir el 
principal fndice de dxito terapeutico. No obs¬ 
tante, se encuentran disponibles varias medi- 
das directas de la distorsidn cognitiva. En el 
cuadro 14-11 se resumen unos cuantos instru- 
mentos destacados. Pueden cncontrarse otros 
cjcmplos cn Clark (1988). Estos instrumentos 
son principalmente cuestionarios de investi- 
gacidn adecuados para el examen de las dife- 
rcncias individuates, pero no se han validado 
de manera suficiente para la evaluacidn indivi¬ 
dual. Clark (1988) critica a los creadores de los 
cuestionanos dc dislorsidn cognitiva dc publi- 
car prematuramente sus instrumentos. En par¬ 
ticular. este autor senala la falta de investigation 


sobre validez concurrente y de discriminaciOn 
en la mayor parte dc las medidas dc autoafirma- 
ciones. Otro problema cs que los cuestionarios 
existentes sc disenaron para validar construc¬ 
ts en investigacidn y, en consecuencia. no fun- 
ciona bien cn la prdctica clfnica. 

Una medida cxccpcional y bien validada 
que no se encuentra incluida en el cuadro 14-11 
es el Beck Depression Inventory, BD1 (Inven- 
tario de DepresiOn Beck). El BDI es un cues- 
tionario corto y scncillo dc autoinforme que se 
enfoca. en parte, cn las distorsioncs cognitivas 
que subyacen a la depresidn (Beck y Steer, 
1987; Beck, Ward, Mendelsohn, Mock y 
Erbaugh, 1961). Una razdn para su populari- 
dad es que la mayorfa de los individuos pueden 
contestar los 21 reaclivos del BDI en 10 minu- 
tos o menos. La prueba se ha utilizado amplia- 
mente y se han publicado mds dc 1 900 artfculos 
que utilizan el BDI (Conoley, 1992). En 1996 
se publied una segunda cdicidn (Beck, Steer y 
Brown, 1996). En el BDI-II, se revisaron va- 
rios reaclivos a fin dc lograr que el inventario 
sc conformara de manera mas cercana a los cri- 
terios diagndsticos prevalecientes para la de- 
presion. Los 21 reaclivos se presentan de la 
siguiente forma: 

Marque la afirmaciOn que siente mas cier- 
ta acerca de usted dentro de este grupo: 

0 Soy optimista acerca del futuro. 

1 Siento un levc desaliento acerca del futuro. 

2 Siento que el futuro tiene poco que ofre- 
cerme. 

3 Siento que no hay ninguna esperanza en el 

futuro. 

Trece reactivos abarcan componentes cogni- 
tivos y afcctivos de la depresidn como pcsi- 
mismo, culpa, llanto, indecision y autoacu- 
saciones; ocho evaluan variables somdticas y 
de desempefio como problemas de suefio, ima- 
gen corporal, dificultadcs laboralcs y pdrdida de 
interns en el sexo. La persona examinada recibe 
una calificacidn de 0 a 3 para cada reactivo; la 
puntuacidn natural total es la suma de las afir- 
maciones refrendadas en los 21 reactivos; la ca- 
lificacidn maxima posible es 63. 
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Cuadro 14-11. Medidas de cuestionario de la distorsion cognitiva 

Anxious Self-Statements Questionnaire (ASSQ) (Cuestionario de Autoafirmaciones de Ansiedad) 
Kendall y Hollon (1989) 

La persona examinada calilica con que Irecuencia ocurrieron pensamientos especificos de ansiedad 
a lo largo de la ultima semana. Los reaclivos tienen la siguienle forma: 

Ya no lo puedo soportar 
^Ahora qud me va a suceder? 

No voy a lograrlo 

El ASSO es un inslrumento psicomdtricamenle sdlido y puede utilizarse para evaluar los cambios en la 
frecuencla de la pldtica ansiosa interna. 

Automatic Thoughts Questionnaire (ATQ) (Cuestionario de Pensamientos Automdticos) 

Hollon y Kendall (1980); Kazdin (1990) 

El ATQ es una medida de la frecuencia de las cogniciones relacionadas con la depresidn que evalua 
la desadaptacidn personal, negatividad en autoconceplo y expectalivas, baja autoeslima y desamparo/ 
darse por vencido. El ATQ tiene 30 reaclivos y se correlaciona muy bien con la Escala de depresidn del 
MMPI y el Beck Depression Inventory (Ross, Gottfredson. Christensen y Weaver, 1986). 

Cognitive Errors Questionnaire (CEO) (Cuestionario de Errores Cognitivos) 

Lefebvre (1981) 

El CEQ evalua el grado de pensamienlo desadaptado en siluaciones generates y tambidn en aqudllas 
relacionadas con lumbalgia crdnica. A una serie de vinetas separadas relacionadas con la lumbalgia 
crdnica y escenas generates le siguen cogniciones disfdricas ildgicas. La persona que responde al 
cuestionario indica en una escala de dnco puntos que tan simitar es la cognicidn al pensamiento que 
pudiera tener en la misma situacidn. Por ejemplo: "Usled acaba de pasar Ires horas limpiando el sdlano 
de su casa. Sin embargo, su cdnyuge no dice nada al respecto. Listed piensa para s( mismo(a). f*l 
(ella) debe creer que hice un mal trabajo”. Smith, Follick, Ahem y Adams (1986) enconlraron que la 
generalizacidn excesiva era el error cognitivo especffico del CEQ que se correlacionaba de manera 
mas consistenle con la discapacidad por lumbalgia crdnica. 

Attribution Styles Questionnaire (ASQ) (Cuestionario de Estilos de Atribucidn) 

Seligman, Abramson, Semmel y Von Baeyer (1979) 

El ASQ mide Ires dimensiones de atribucidn relacionadas con el modelo de desamparo aprendido de 
Seligman para la depresidn: dimensiones intema-exlerna, estable-inestablo, y global-especifica. Las 
personas depresivas atribuyen los malos resultados a causas internas, eslables y globales, mientras 
que atribuyen los buervos resultados a causas externas e inestables. El cuestionario consiste de 12 
situaciones hipotdticas, seis de las cuales describen buenos resultados y seis que describen malos 
resultados (p. ej„ “Durante algtin tiempo, usted ha estado buscando empleo sin lener dxito"). La persona 
calilica cada vineta en una escala de siete puntos segtin el grado de intemalidad, eslabilidad y globalidad. 

Hopelessness Scale (HS) (Escala de Desesperanza) 

Beck (1987), Dyce (1996) 

La HS es una escala con 20 reactivos de cierto/faiso que se disend para cuanlificar la desesperanza, un 
components de la trfada cognitiva negaliva que se encuentra en las personas depresivas. (La trlada 
incluye las perspectivas negativas acerca de si mismo, el mundo y el fuluro.) La escala es sensible a 
cambios en el eslado depresivo del paclente. En un esludio de valldacldn. Beck, Riskind, Brown y 
Steer (1988) enconlraron que las calificaciones en la HS tenian una relacidn Insignificante con la 
ansiedad o la psicopatologla en general cuando se separaba la influencia de depresidn coexistente. 
Asi, la HS parece medir un atributo especifico de depresidn mas que la psicopatologfa general. 
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En un mctaanalisis de ios estudios dc in¬ 
vestigation con el BDI, la consistence interna 
de la escala (coeficicnte alfa) fue dc .73 a .95. 
con una media de .86 en nueve poblacioncs psi- 
qui.'itricas (Beck. Steer y Garbin. 1988). El BDI- 
II posec cxcclcnte consistencia interna con un 
coeficiente alfa de .92 (Beck, Steer y Brown. 
1996). La confiabilidad test-retest del BDI es 
modcsta, con un rango de .60 a .83 en muestras 
no psiquidtricas y de .48 a .86 en muestras psi- 
quidtricas. Sin embargo, la mctodologfa test- 
retest no cs muy adecuada para fendmcnos 
como la depresidn que son incstables por natu- 
ralcza. La depresidn subjetiva fluctiia de ma- 
nera notable dc una semana a la siguicnte, dfa a 
dfa e incluso de una hora a otra. Un valor me¬ 
diocre de confiabilidad test-retest podrfa signi- 
ficar un cambio valido en el constructo que se 
mide mds que un error indcseable de medicidn. 

Se encucntra disponiblc una variedad dc 
resultados normativos con datos del BDI para 
muestras de pacientes con depresidn mayor, 
distimia, alcoholismo, adiccion a la hcroma y 
problemas mixtos. El manual tambidn propor- 
ciona pautas para el grado de depresidn con base 
en la calificacidn del BDI (0 a 9, normal; 10 a 
19, leve a moderada; 20 a 29. moderada a gra¬ 
ve; 30 en adelante, sumamcntc grave). Estas ca- 
lificacioncs se basan en las valoracioncs clfnicas 
de Ios pacientes. 

El BDI sc ha validado de mancra cxtensa 
contra otras medidas y critcrios independien- 
tcs de la depresidn. Por ejemplo, las correla- 
ciones con calificaciones clfnicas y cscalas de 
depresidn como la del MMPI sc encuentran por 
lo comun en el rango de .60 a .76 (Conoley, 
1992). Las diferencias scxualcs son mfnimas, 
aunque existcn diferencias leves en la cxpre- 
sidn de la depresidn entre varones y mujeres 
(Steer, Beck y Brown, 1989). 

El unico defecto del BDI es su transparen¬ 
cy. Los pacientes que desean ocultar su deses- 
peracidn o exagerar su depresidn pueden 
haeerlo con facilidad. No obstante, en el caso 
de pacientes motivados a reflejar de manera 
precisa su estado emocional, es probable que 
el BDI y el BDI-II sean invcnciblcs como fndi- 
ecs dc la presencia y grado de la depresidn 


(Stchouwer, 1987). Algunos profesionalcs lc 
piden a Ios pacientes que respondan al BDI 
despuds de cada scsidn tcrapdutica; lo utilizan en 
mucho como podrfan cmplcar un termdmetro. 

PROCEDIMIENTOS DE AUTOMONITOREO 

Una concepcidn errdnea comtin accrca de la 
tcrapia conductual es que consiste de un tcra- 
peuta autoritario que le aplica recompensas y 
castigos poderosos a los clicntcs pasivos. Aun¬ 
que estc modclo estcreotipado puede scr cicrto 
con algunos clientes discapacitados que tienen 
rcpertorios conductuales limitados, en su ma¬ 
yor parte la terapia conductual la realizan pro- 
fcsionalcs humanitarios que le ensenan a sus 
clicntcs mdtodos de autocontrol. En todas las 
formas dc terapia conductual cs fundamental 
un dnfasis en el automonitoreo. En dstc, el 
clicnte elige las metas y participa dc manera 
activa en supervisar, esquematizar y registrar 
el progrcso hacia la finalidad o finalidadcs dc 
la terapia. Segun cste modclo, al terapeuta se lc 
relega a un papel de ascsor experto. 

Los proccdimientos de automonitoreo son 
especialmcnte utiles en el tratamiento dc la de¬ 
presidn, un trastomo conductual prcpondcran- 
te que consiste dc estado de dnimo triste, bajo 
nivel de actividad, sentimientos de minusvalfa, 
problemas de conccntracidn y sfntomas ffsicos 
(pdrdida de suefio, trastomo del apetito, menor 
interds en el sexo). Se han presentado varios 
programas de automonitoreo para la depresidn 
(Lewinsohn y Talkington, 1979; Rehm, 1984; 
Rchm, Komblith, O’Hara y cols., 1981). A fin 
de ilustrar el enfoque del automonitoreo para cl 
control de la depresidn, se resumird un peque- 
fio trozodcl programa que impulsan Lewinsohn 
y sus colaboradores (Lewinsohn, Munoz, 
Youngrcn y Zeiss, 1986). 

Lewinsohn observd que la depresidn va de 
la mano con una notable reduccidn en la expe¬ 
rience de acontecimicntos agradables. Las 
personas deprimidas sc alejan de participar en 
actividades agradables; el retraimiento conduc¬ 
tual sdlo contribuye a aumentar su depresidn. 
incitando a que sc produzca una conlinua cspiral 
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hacia abajo. Por fortuna, es posible rcempla- 
zarla con una espiral hacia arriba. Para ayudar 
a revertir la espiral inverlida de la depresidn, 
Lewinsohn y sus colaboradores discftaron el 
Pleasant Events Schedule , PES (Inventario de 
Acontecimicntos Placentcros; MacPhillamy y 
Lewinsohn, 1982). El propdsilo del PES cs do- 
ble. Primero, en la fase de evaluacidn de Ifnea 
base, esta prueba sc utiliza para automonitorear 
la frecuencia (F) y agradabilidad (A) de 320 
acontecimientos comunes. cotidianos. Ejemplos 
de los tipos de acontecimicntos quc se listan en 
el PES incluyen: 

Lectura de revistas. 

Salir a caminar. 

Estar con mascotas. 

Tocar un instrumento musical. 

Preparer comidas para caridad. 

Escuchar cl radio. 

Leer poesfa. 

Asistir a servictos rcligiosos. 

Mirar un evento dcportivo. 

Jugar baraja con un amigo. 

Trabajaren mi empleo. 

La frecuencia y agradabilidad de cstos hechos 
cotidianos se califican de 0 a 2.* A partir de 
esto se .-alcula la tasa media de actividadcs pla- 
centeras al sumar las calificacioncs F x A, es 
decir, tasa media = F x A/320. Los datos nor- 
mativos para la media de F, media de A y media 
de F X A se presentan en Lewinsohn, Munoz, 
Youngren y Zeiss (1986) y sirven como base 
para planificar cl tretamiento. Los participan- 
tcs en cl programa de Lewinsohn tambidn rc- 


• La Escala de frecuencia se calibra como siguc: 

0 —Esto no ha sucedido en los pasados 30 dfas. 

1 —Esto ha sucedido unas cuantas veces (I a 6 vc- 

ccs) en los pasados 30 dfas. 

2 —Esto ha sucedido con frecuencia (7 veces o mis) 

en los pasados 30 dfas. 

La Escala de agradabilidad se calibra como siguc: 

0 —Esto no fue agradable 

1 —Esto fue un poco agradable. 

2 —Esto fue muy agradable. 


gistren su cstado de inimo diario de mancra 
sencilla de 0 (peor) a 9 (mejor). 

La segunda utilizacidn del PES es automo¬ 
nitorear el progreso terapdutico. Con base en 
los resultados iniciales de la prueba, los clicn- 
tes idcntiftcan aproximadamente 100 aconteci¬ 
mientos agradables en potcncia y se esfuerzan 
por aumentar la frecuencia de £stos, registran- 
do su estado de inimo de manera cotidiana. En 
general, los clientes que aumentan la frccucn- 
cia de hechos placenteros muestran una mejo- 
rfa en cstado de ini mo y en otros sfntomas 
depresivos. 

El PES es una herramienta muy dtil para 
los clfnicos quc dcscan poner en marcha el enfo- 
que de automonitoreo para la evaluacidn y tra- 
tamiento de la depresidn. MacPhillamy y 
Lewinsohn (1982) informan conclusiones fa- 
vorablcs accrca de las cualidades tdcmcas del 
PES y analizan una variedad de subescalas ra- 
cionalcs, factoriales y cmpfricas que no pue- 
den revisarse aquf. El instrumento ticne una 
confiabilidad test-retest que va de adecuada a 
buena (correlaciones a un mes dentro del ran- 
go de .69 a .86), excelcntc validcz concurrente 
con observadores entrenados y una promete- 
dora validez de constructo. En general, las 
subescalas se comportan como podrfa prede- 
cirse con base en los constructos que preten- 
den medir —sc rcficre al lector a MacPhillamy 
y Lewinsohn (1982) para mayores dctalles. 

Los enfoques de automonitoreo para la eva- 
luacidn conductual ticncn aplicaciones en mu- 
chas subespecialidades de la psicologfa y de las 
profesiones de salud. Se describiri de manera 
breve otro instrumento de evaluacidn para ilus- 
trar la diversidad de mdtodos disponibles. 
Schlundt y Bell (1993) desarrollaron el Body 
Image Testing System (Sistcma de prueba de la 
imagen corporal; BITS) para utilizarse con 
microcomputadora, que tiene el propdsito de 
evaluar la imagen corporal de personas con 
trastomos de la alimcntacidn. El trastomo ali- 
menticio conocido como anorexia nerviosa se 
caracteriza por la negativa a mantencr un peso 
corporal normal, un intenso temor a subir de 
peso y un trastorno significativo de la percep- 
cidn de la forma o tamafio del cuerpo. La ma- 
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yoria dc los pacientes con anorexia nerviosa 
son mujeres j6venes —la edad promedio dc ini- 
cio es de 17 afios. Una persona con este tras- 
tomo percibc su cucrpo como mds grueso de 
lo quc es en realidad. Pcro £cbmo pucde mcdir- 
sc y cuantificarse esta percepcibn equivocada? 
El programa BITS es un enfoque para el 
automonitoreo dc las dislorsiones cn la imagen 
corporal. En pocas palabras, la persona utiliza 
un mend para cambiar una imagen corporal ge- 
nerada por computadora hasta que se asemeje 
a su percepcibn de sf misma. 

Las instrucciones para el programa BITS 
especifican quc la sujeto ha de ajustar las par¬ 
tes individuates del cucrpo hasta que la imagen 
se parezea a sus dimensiones corporales rea- 
les. En un segundo ensayo, la sujeto genera di- 
mensioncs corporales idcalcs. La discrepancia 
entre las dimensiones reales e idealcs representa 
el grado dc salisfaccibn de la sujeto con su pro- 
pio cuerpo. Adcmds, el programa BITS produ¬ 
ce un fndice de distorsibn perceptual que se basa 
en un andlisis de regresibn de la altura y peso 
contra la imagen corporal autogenerada (real). 

Al utilizar los datos de 94 mujeres, es- 
tudiantes de pregrado, a quienes se volvib a 
sometcr a prueba despuds de dos a cuatro sc- 
manas. se encontrb que las medidas del BITS 
tenlan una confiabilidad accptable. Por ejem- 
plo, las calificacioncs de salisfaccibn general 
para las nueve partes del cuerpo mostraron una 
confiabilidad test-rerest de .80. Tambidn cstdn 
disponiblcs los datos normativos de 528 indi- 
viduos, obtenidos principaimente de muestras 
de pregrado. Sc encontrb quc la validez de 
constnicto es muy prometedora. con base en 
Ires fuentes de informacibn: fuertes correlacio- 
nes entre las califtcaciones del BITS y el tama- 
fio corporal real; fuertes correlaciones entre las 
variables del BITS y otras medidas de la ima¬ 
gen corporal; y capacidad de la medida para 
predecir trastomos en la alimentacibn como ha- 
cer dietas, comer en cxceso y comer para satis- 
facer necesidades emocionalcs. 

El proccdimiento BITS es un cjcmplo ex- 
celcnte de una nueva generacibn de pruebas psi- 
colbgicas que se han vuelto posiblcs por los 
recientes avances en la tecnologia dc cbmputo. 


Las pruebas que le dan un uso creativo a los 
grdftcos por computadora para presenlar cs- 
timulos, respuestas o ambos, se volverdn cada 
vez mds comunes en el future. En el Tema 15A 
sc analizan los enfoques adicionales para la eva- 
luacibn psicolbgica asistida por computadora. 


evaluaci6n de la conducta 

NO VERBAL 


La conducta no verbal incluyc las formas su- 
tiles dc comunicacibn humana contenidas en la 
mirada, ademancs, lenguaje corporal, tono de 
voz y expresibn facial. Aunque la comunica- 
ci6n no verbal representa un papel crucial en la 
conducta humana, nuestro conocimiento de ella 
es muy incompleto. Esta ignorancia refleja, en 
parte, la fuerte orientacibn verbal de nuestra 
sociedad; se hace una equivalcncia entre co¬ 
municacibn y empleo exitosos dc las pala¬ 
bras. Pcro cxistcn otras razones mds sutiles 
para la falta de conocimiento cientffico acerca 
de la comunicacibn no verbal: 

Los diferentes tlpos de comunicacibn no verbal 
se encuentran tan incrustados on nuestras vidas 
cotidianas que utilizamos los mensaies no ver- 
bales sin lener conciencia de ellos. Por ejemplo, 
cuando nos formamos una opinlbn acerca de 
cbmo es una persona, es probable que dicha opi¬ 
nlbn se base en parte en un anbllsls complejo de 
la informacibn no verbal Cuando concluimos que 
alguien a quien acabamos de conocer estb eno- 
Jado o celoso o ansioso por irse, es posible que 
hayamos llegado a esta concluslbn tanto por es- 
cuchar el tono de voz de la persona y observar 
que tan agitados son sus movimientos o por ba- 
bemos formado una impresion de la calldez de 
su expreslbn facial como por interpretar lo que 
en realldad se dijo (Rosenthal, Hall, DiMatteo, 
Rogers y Archer, 1979). 

En esta seccidn se investigard el estudio cientf- 
fico de la comunicacibn no verbal, con un en¬ 
foque sobre las herramientas y metodos que 
pueden utilizarse con propbsitos dc cvaluacibn. 
Se comenzard con una revision de los mdtodos 
que se utilizan para discernir la naluraleza de 
la personalidad subyacente a partir dc signos 
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conductuales cxtemos como la interaccidn vi¬ 
sual, las senates paralingUfsticas (p. cj., (ono de 
voz) y la expresidn facial. El capitulo cierra con 
un andlisis del Perfile of Nonverbal Sensitivity 
(Perfil de sensibilidad no verbal; PONS), una 
fascinantc prueba con pclfcula o video para eva- 
luar la sensibilidad a la comunicacidn no ver¬ 
bal de otras personas. 

INTERACCION VISUAL 

Dcsdc hace mucho tiempo se ha reconocido que 
la intcraccidn visual es clave para otros aspcctos 
de la personalidad, aunque solo ha sido cn los 
ultimos decenios que ha aparccido la investiga- 
ci6n sistem;itica sobrccste tema. Nielsen (1962) 
Ilev6 a cabo la primera investigation empfrica 
accrca de la mirada cn la conducta social. Su 
cstudio fue puramente un andlisis observational 
de la confrontacidn social y la interaccidn vi¬ 
sual. Poco despuds, otros investigadores comen- 
zaron a rcalizar cstudios programdticos cn los 
que se emplearon disenos expcrimcntales es- 
tandarizados, con el contacto visual como varia¬ 
ble dependiente y, despuds, como variable 
independiente (resumidos en Argyle y Cook, 
1976; Fehr y Exline, 1987; Exline y Fehr, 1982). 
En gran medida, csta investigation ha buscado 
determinar las implicaciones de diferencias 
individuates como el inicio, mantenimiento y 
comodidad con cl contacto visual individual 
y mutuo. De cstos cstudios han surgido unas 
cuantas generalizaciones frdgiles que se resu- 
mirdn mds adelante. No obstante, es mds necc- 
sario mencionar el consenso bdsico accrca de 
la dificultad para obtener medidas significa- 
tivas de la interaccidn visual. Pcrm/tascnos re- 
visar de manera breve las conclusiones y despuds 
sc rcsenardn los obstdculos para la investigacidn 
util sobre este importante tema. 

Es mejor considerar a la interaccidn visual 
como una conducta social que aclua como una 
poderosa serial de una persona a otra. El signi- 
ficado de la serial se determina de muchas ma- 
ncras complejas, de modo que la interpretation 
del patr6n de mirada de otra persona es muy 
diffcil. Sin embargo, sf han surgido varias con¬ 


clusiones consistcntes acerca de la investig a . 
ci6n sobre el tema (Argyle y Cook, 1976; Fehr 
y Exline, 1987); 

1. La mirada actua con frecucncia como una 
serial de agrado, en especial por parte de 
personas dependientes. 

2. La mirada mutua, cn especial si es prolon- 
gada, puede significar un tipo especial dc 
intimidad. 

3. Las personas extravertidas y que tienen con- 
fianza en sf mismas cstablecen contacto vi¬ 
sual con mayor frecuencia y por periodos 
mds largos. 

4. La aversion a la mirada aumenta cuando 
las personas estdn ccrcanas entre sf o dis- 
cuten temas fntimos. 

5. Las personas poco honradas rcducen la 
intcracciOn visual durante cpisodios de cn- 
gaflo. 

6. Las mujeres fijan la mirada con mds fre¬ 
cuencia, incluso en la lactancia. 

7. La cantidad dc interacciOn visual es alia du¬ 
rante la infancia, disminuye en la adolcs- 
cencia y despuds vuelve a elevarse. 

8. Las personas afilialivas fijan mds la mirada 
en siluaciones cooperati vas, pero mcnos en 
situaciones compctitivas. 

9. Las personas con un estatus inferior fijan 
mds la mirada que las personas con mayor 
estatus. 

10. Existen notables diferencias culturales; las 
personas drabes y latinoamcricanas tienen 
mayor interacciOn visual; ciertos grupos 
amerindios tienen menor interacciOn visual. 

11. Las personas con autismo, esquizofrenia y 
depresiOn tienden a evitar mirar a otras per¬ 
sonas. 

De la lista anterior deberfa ser obvio que la in- 
terpretacidn de la interaccidn visual depende 
de numcrosas variables y tambidn estd bajo la 
influcncia dc la interaccidn entre variables 
(p. cj., afiliacidn y competencia). 

El profcsional que desee interpretar las di¬ 
ferencias individuales en interaccidn visual pri- 
mero debe poner en prdctica un paradigma de 
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algun tipo para la rccolccci6n dc dates. Exlinc 
y Felir (1982) han llamado la atencibn hacia las 
dificultades implicadas en la evaluacibn de la 
mirada y dc la mirada mutua. Estas dificulta¬ 
des incluyen la reaclividad a las incdiciones 
realizadas en ambientes dc laboratorio y los 
problemas dc confiabilidad dc las mediciones. 
Son muchos los problemas practices para eva- 
luar e interpretar la intcraccibn visual. Dc he- 
cho, es muy probable que los obstbculos 
impidan el dcsarrollo de pruebas estandarizadas 
para la medicibn dc la mirada y dc la mirada 
mutua. No obstante, cl conocimicnto accrca dc 
los hallazgos en csta Area puede utilizarse jun¬ 
to con otras senates no verbales en aplicacio- 
nes clfnicas practicas como la detcccibn del 
engano (Ekman y Fricscn, 1975). 

PARAUNGUISTICA 

La paralingufstica sc rcficrc al tono dc voz, 
tasa de vcrbalizacioncs y otros aspcctos no ver- 
balcs del habla. Con frecucncia, las scfialcs 
paralingtlfsticas son mbs poderosas que cl men- 
sajc hablado explfcito, como cuando se dice: 
“No es lo que dijo, sino c6mo lo dijo”. Una 
mbxima esencial de la invcstigacion paralin- 
glifstica es que se debe separar el contenido del 
discurso dc sus malices afectivos. 

Una importante drea de la evaluacibn pa- 
ralingUfstica tiene que ver con la emocibn juz- 
gada a partir del discurso con “filtracibn del 
contenido”. En bste, sc graba la voz de una per¬ 
sona (o sc vuclvc a grabar una cinta dc audio) a 
travbs dc un fillro de baja frecucncia para cli- 
minar los sonidos de alia frecuencia y con ello 
hacer que las palabras se vuelvan irreconoci- 
bles. El discurso con filtracibn de contenido 
manticnc los aspcctos paralingUfsticos cscncia- 
Ics del habla (variacibn en tono y contomo; rit- 
mo, volumcn, tonalidad y ritmo), pero elimina 
la distraccibn polcncial del contenido. Jucccs 
entrenados califican entonces el discurso con 
filtracibn de contenido en cuanto a componen- 
tes afectivos como cnojo o ansiedad. 

Milmoe, Rosenthal, Blane, Chafetz y Wolf 
(1967) llevaron a cabo un estudio que ha servi- 


do dc gufa y que ilustra las aplicaciones prbeti- 
cas del discurso con Filtracibn de contenido. 
Estos investigadores grabaron las voces dc 
mbdicos residentes que habfan terminado su 
servicio en una clfnica de alcoholismo. En par¬ 
ticular. los investigadores obtuvicron los frag- 
mentos de las rcspucstas dc los mbdicos a la 
pregunta dc cnlrevista, “^Cubl ha sido su expe¬ 
rience con alcohblicos?”. En bstas se filtrb el 
contenido y despubs un panel de jueces califi- 
cb la presencia de enojo, compasibn, ansie¬ 
dad y neutralidad* cn una escala de 6 puntos 
(I = ninguno, 6 = mucho). La confiabilidad 
internalificadores para las dimensiones cmocio- 
nalcs varib en gran medida y tambibn se vio 
afcctada por cl sexo del juez. Por cjemplo, la 
concordance entre los jueces varoncs y mujeres 
fue buena en cuanto a ansiedad (r = .84), pero 
no existente para neutralidad (r = -.07). 

Los investigadores tambibn obtuvieron in- 
formacibn ulterior sobre cl bxito dc los mbdi- 
cos para lograr que los pacientes alcohblicos 
buscaran tratamiento. Los datos paralingUfsti¬ 
cos (calificacioncs dc cnojo, compasibn. ansie¬ 
dad y neutralidad) se correlacionaron entonces 
con los datos objetivos de eficacia en la canali- 
zacibn. Las calificacioncs dc los jueces para el 
enojo en el discurso con filtracibn de conteni¬ 
do se correlacionaron en gran medida con la 
eficacia para canalizar a los pacientes alcohbli¬ 
cos (r = -.67, p = .06). Otras variables no tu- 
vieron relacibn con la eficacia. En sfntesis, los 
mbdicos con altas calificaciones paralingUfs- 
ticas dc cnojo fueron poco cfcctivos para con- 
vcnccr a los pacientes alcohblicos de que 
buscaran tratamiento. El mismo cquipo dc in- 
vcstigacibn ha mostrado que las calificaciones 
dc la voz matema (con filtracibn de contenido) 
se correlacionan con aspectos de la conducla 
del recibn nacido como irritabilidad, inseguri- 
dad y atcncibn (Milmoe, Novey, Kagan y 
Rosenthal, 1974). 


* Otras dos dimensiones sc calificaron a partir del 
contenido dc las cintas: complejidad y comprensidn 
psicolbgica. En estc caso no se analizan estas conclu- 
sioncs. 
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EXPRESION FACIAL 

La comunicacidn no verbal sc media con fre- 
cuencia por la expresibn facial. Dc hecho, el 
aparato de expresibn facial se dcdica en gran 
medida a la manifestacibn facial de emocidn. 
Adcmas. el rostro ayuda a regular varias fun- 
cioncs no emocionales como la produccibn del 
discurso, la alimentacibn, rcspiracion, olfato y 
protcccibn de los ojos. 

El papel crucial del rostro en la comuni- 
cacion a travbs dc la prcscntacibn de emocio- 
nes ha impulsado a los investigadorcs a de- 
sarrollar metodos objetivos para observar y 
cuantificar la accidn facial. Han surgido dos 
metodos importantes para este propbsito: 1) me- 
dicibn dc las acetones faciales visibles utilizando 
sistemas dc codiftcacibn facial y 2) medicidn 
de dcscargas eldctricas producidas por la con- 
traceion de los musculos faciales. Ekman 
(1982) y Fridlund. Ekman y Osier (1987) rc- 
visaron en detaile ambos desarrollos. Aquf sc 
destaca el sistema dc codificacibn facial mas 
conocido. 

El Facial Action Codying System, FACS 
(Sistema de codificacibn de la accibn facial; 
Ekman y Friesen, 1978) se desarrollb como una 
herramienta de evaluacibn con Fines generalcs 
adecuada para una amplia gama de propdsitos 
de investigacibn y cvaluacidn. Con base en un 
claborado anblisis clectrofisioldgico del papel 
prcciso de cada musculo del rostro en la expre- 
sidn facial visible. Ekman y Friesen obtuvieron 
44 unidadcs de accibn (UA) que pueden, solas 
o en combinacibn, explicar todos los movi- 
mientos faciales visibles. Todas las UA reci- 
ben una calificactbn en una escala de intensidad 
dc cinco puntos. Por cjcmplo, la UA 1 tiene 
que ver con levantar la ceja. lo cual se contro- 
la a travbs de un mdsculo grande en el brea dc la 
frente. Ekman y Friesen (1978) proporcionan 
instrucciones dctalladas para caliFtcar cada UA 
a partir de grabaciones de vfdco. El FACS tam- 
bidn permite la codificackin del tiempo de ini- 
cio, cuspide y terminacidn de cada UA. 

El FACS es diffcil de aprender y de utilizar 
debido a que requiere ver de manera repetida y 
en cbmara lenta las accioncs faciales. No obs¬ 


tante, una vez que se domina el sistema, jueces 
competcntes producen califtcaciones sumamen- 
tc conftables de las acciones faciales. Lo que 
es mbs. las califtcaciones predicen estados emo- 
cionales con una precision considerable. En un 
importantc estudio dc validez. Ekman, Friesen 
y Ancoli (1980) registraron la accidn facial de 
personas que observaban pclfculas tanto 
agradables como dcsagradables. El FACS pre- 
dijo dc manera precisa los informes retrospec- 
tivos dc los indi viduos acerca de su experience 
cmocional (felicidad, sentimientos negativos, 
repugnancia). A1 menos en algunos contcxtos, 
las acciones faciales particulares si indican 
emociones particulares. Lo que necesita csta- 
blecerse en la investigacibn futura es la genera- 
lidad del vinculo entre las accioncs faciales 
codificadas del FACS y la experiencia de emo¬ 
ciones pronosticadas. 

PERFIL DE SENSIBILIDAD NO VERBAL 

Robert Rosenthal y sus colaboradores desarro- 
llaron Profile of Nonverbal Sensitivity, PONS 
(Pcrftl de Sensibilidad no Verbal), en cl dccc- 
nio dc 1970 para estudiar la capacidad para 
comprendcr las senates no verbalcs trasmilidas 
por cxprcsioncs faciales, movimientos corpo- 
rales y tono de voz (Rosenthal, Hall. DiMatteo, 
Rogers y Archer. 1979). Un impulso para la 
invencidn dc este nuevo instrumento de eva- 
luacidn fue el descubrimiento anterior de 
Rosenthal acerca del efecto de la expectativa 
del experimentador (Rosenthal. 1967). La in- 
vestigacidn sobre cl efccto de la expectativa del 
experimentador mostrd que cl investigador pue- 
dc influir sin intcncidn sobre los individuos y 
cambiar con ello su conducta en direccidn de 
las expectativas del experimentador, con locual 
se crca una profeefa autocumplida en el labora- 
torio de investigacidn y en cl saldn de clase. 
Rosenthal razond que cl efecto de la expectati¬ 
va del experimentador debe facilitate a travds 
dc la comunicacidn involuntaria de informacidn 
no verbal del experimentador al individuo. El 
PONS se desarrolld, en parte, para estudiar la 
manera en que podrian decodificarsc cstas co- 
municaciones no verbales. 
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Los cstfmulos del PONS se apiican por 
medio de pclfcula o videocinta y consisten de 
220 segmentos de dos segundos acerca de la 
conducta no verbal de una mujer.* Para cada 
reactivo estfmulo, la persona examinada debe 
elegir qud situacidn afcciiva o emocional se esti 
represcntando; en el protocolo de respuesta se 
scnalan dos altemativas. Por ejcmplo, un reac¬ 
tivo visual muestra el rostro de la mujer duran¬ 
te dos segundos mientras representa una escena 
emocional. Se pide al individuo examinado que 
elija entre dos descripcioncs de lo que esti ha- 
ciendo la persona: a) reganar a un nifio o b) ex- 
presar enojo por cclos. Kn este reactivo se 
"corta" el audio, de modo que la persona exa¬ 
minada tiene que<dccodificar la informacidn a 
partir unicamente de la expresidn facial. Dado 
que la mujer que hace la representacidn sc cn- 
cuentra a la vista durante sdlo dos segundos. 
existe poca oportunidad de que cl individuo 
utilice la lectura de labios para obtener infor- 
macidn verbal util. 

El PONS evalua la capacidad de la perso¬ 
na examinada para decodificar conducta no 
verbal a partir de 11 canales diferentes. £stos 
incluyen tres que son canales visuales “puros”, 
dos auditivos (de paralenguaje) diferentes y scis 
combinados (visuales y auditivos). Los visua¬ 
les incluyen: 

1. El rostro. 

2. El cuerpo del cuello hasta las rodillas. 

3. La figura completa. 

Los canales auditivos incluyen los siguientes: 

4. La voz empalmada al azar (EA) de la ha- 
blante. 

5. La voz con filtracidn dc contenido (FC) 
de la hablante. 

Los canales combinados incluyen: 

6. El rostro mis la voz EA. 

7. El cuerpo mis la voz EA. 

8. La figura mis la voz EA. 


* El PONS puede obtenerse cn cinco vcrsioncs, inclu- 
yendo sdlo audio, sdlo video. PONS breve y prueba 
de discrepancy no verbal Aqui dnicamentc se anali- 
za el PONS complcto. 


9. El rostro mis la voz FC. 

10. El cuerpo mis la voz FC. 

11. La figura mis la voz FC. 

En los PONS, se muestra a la intdrprete expre- 
sando 20 situaciones afectivas o emocionales 
diferentes que van desde cmociones relativa- 
mente sutilcs (p. ej., “expresar amor materno’’) 
hasta situaciones mis dramiticas (p. cj., “ame- 
nazar a alguien"). Dado que cada una de las 20 
escenas aparece en cada uno de los 11 canales. 
la prueba consistc dc un total dc 220 escenas. 
El PONS requicrc cerca de 45 minutos para 
completarla. 

La principal muestra dc cstandarizaci6n 
para cl PONS consiste de 492 estudiantes dc 
preparatory publica de tres lugares (costa oes- 
tc. medio oestc y costa este) en EUA. Estos in- 
dividuos tenfan una inteligencia promedio y 
provenian pnncipalmente de familias de clase 
media. Al utilizar la f6rmula KR-20. los auto- 
res calcularon las correlaciones dc consisten¬ 
cy interna de los rcsultados de prueba de estos 
estudiantes. Dichos resultados indican, en ge¬ 
neral, una homogcncidad adecuada para los 
canales individuales, con la evidente exccpcidn 
del canal dc voz empalmada al azar (r = .06). 
Por desgracia, se encontrd que los coeficientes 
dc estabilidad test-retest para las calificacio- 
nes de canal del PONS eran margi nates cuando 
mucho (cuadro 14-12). Con base cn 293 estu¬ 
diantes a quienes sc volvid a examinar despues 
dc 10 dfas a 10 semanas, la mayor parte de las co- 
rrelacioncs test-retest para las calificacioncs de 
canales individuales se locaiizaron en los ran- 
gos de .20 y .30. El unico cocficiente dc estabi¬ 
lidad que resultd aceptable de mancra marginal 
sc bas6 en la escala completa (/• = .69). 

La validez del PONS se ha investigado en 
docenas de estudios que resumen los autores 
(Rosenthal y cols., 1979). En general, las co¬ 
rrelaciones con otros indices de sensibilidad 
interpersonal son apropiadamente positivas (en 
apoyo de la validez dc criterio), mientras que 
las correlaciones con variables cogniti vas como 
el Cl son adecuadamentc bajas (en apoyo de la 
validez de discriminacidn). En un interesante 
estudio, se encontr6 que la eficiencia de los 
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Cuadro 14-12. Coeficientes medianos de confiabilidad test-retest 
del PONS de seis muestras (W= 293) 




Canal de video 



Oailol Uc uUulO 

Ninguno 

Rostro 

Cuerpo 

Figura 

Total 

Ninguno 


24 

.34 

.24 

.52 

Empalmada 

al azar 

.18 

.43 

.26 

.20 

.50 

Con fillracibn 

de contenido 

27 

.20 

.24 

.27 

.50 

Tolal 

.32 

.49 

.54 

.51 

.69 


Fuonto: Reproducido con autofttaodn de Rosenthal, R , Hall, J A., DiMalteo, M. R,, Rogers. P L. y Archer, 
0(1078) Sensttivky to nonverbal communication TJtePONSIesI Baltimore, MD Johns Hopkins University 
Press 


funcionarios del Servicio Exterior se corre- 
lacionaba cn .30 con las calificaciones de la 
versidn de audio del PONS; cs deeir, los fun¬ 
cionarios mis eficaces tuvieron mcjorcs rcsul- 
tados que los mcnos eficientcs en cuanto a 
decodificar la informacidn contenida en las 
versiones de voz con fillracidn de contenido y 


de voz empalmada al azar. Por tanto, se puedc 
concluir que la calificacidn total del PONS es 
un fndice adecuado de la sensibilidad a la co- 
municacion no verbal. Sin embargo, los cana- 
les individuales de la prueba poseen tal 
confiabilidad marginal que deberfa utilizdrsclcs 
s6lo con propdsitos de invcstigacidn. 


RESUMEN 


1. La evaluacidn conductual se concentra cn 
cl comportamiento en sf, mis que en los ras- 
gos subyacentes, causas hipoteticas o su- 
pucstas dimensiones de la personalidad. En 
general, la evaluacidn conductual es una 
parte integral de la tcrapia conductual dise- 
fiada para cambiar la duracidn, frecuencia 
o intensidad de una conducta bianco bicn 
definida. 

2. Un enfoque util de evaluacidn en los mdto- 
dos de terapia conductual basados cn la 
cxposicidn es la Behavioral avoidance 
Test (BAT), cn la que el tcrapcula proyecta 
cuanto tiempo puedc tolcrar cl cliente un 
estfmulo inductor de ansiedad. Tambicn son 
utiles los Fear Survey Schedules, que se 
basan cn las calificaciones de la persona 
para objetos y situaciones comunmente tc- 


midos, pero existen razones para cucstio- 
nar su validcz. 

3. En el manejo de contingencias, el terapeuta 
intenta modificar la conducta desadaptada 
al idcntificar las consecuencias reforzantes 
y eliminarlas. A la inversa, las conductas 
adaptativas pueden fortalecerse al disponcr 
que se presenten recompensas cuando estas 
ocurrcn, como en la cconomfa de fichas. 

4. En la terapia cognitiva-conduclual, el tera- 
peula intenta cambiar la cstructura de crecn- 
cias del cliente. Porejemplo, Meichenbauin 
le ensena a los clienles a utilizar auloafir- 
maciones de enfrentamiento (p. ej. t “Tie- 
nes una estrategia... puedes lograrlo”) para 
combatir situaciones estresantes. 

5. Un excelenlc fndice de la depresidn —in- 
cluyendo las distorsiones cognitivas— es 
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el Beck Depression Inventory (BDI), quecon- 
sistc de 21 cuartctos dc afirmaciones orde- 
nadas de mancra jcrdrquica. cada una dc 
las cualcs sc califica de 0 a 3. Al BDI se le 
reconoce como un cxcelcntc fndicc de aulo- 
informe de la dcprcsidn y se le ha validado 
ainpliamentc contra criterios extemos. 

6. Lcwinsohn y sus colaboradores han publi- 
cado el Pleasant Events Schedule para el 
automonitoreo de la frecuencia y agrada- 
bilidad dc hasta 320 conductas principal- 
mentc comunes y cotidianas. Los pacienles 
dcprimidos que aumcntun su frecuencia 
automonilorcada dc acontecimientos agra- 
dables mucslran, por lo general, una mcjo- 
rfa en su estado de tinimo. 

7. El automonitoreo tiene muchas aplicacio- 
nes cn psicologfa y mcdicina. Un cjcmplo 
es cl Body Image Testing System (BITS), 
quc se utiliza para cvaluar las distorsiones 
cn imagcn corporal que se encucntran cn 
la anorexia ncrviosa y otros trastomos de la 
alimentacidn. El BITS le proporciona al in- 
dividuo un menu para cambiar una ima¬ 
gcn corporal generada por computadora 
hasta quc sc parczca a su pcrcepcidn dc sf 
mismo. 

8. Existen varias hcrramicnlas y mdtodos para 
la evaluacidn dc conducta no verbal como la 
interaccidn visual. Por desgracia, lacvalua- 
ci6n de £sta se halla llena de escollos prSc- 
ticos y metodoldgicos; la aplicacidn de estc 
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Evaluation conductual p. 645 

Terapia conductual p. 647 

Behavioral avoidance Test p. 648 

Fear Survey Schedule p. 648 
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cnfoque se restringe a las csludios de in¬ 
vestigation. 

9. La paralingUfstica se reficre al tono dc voz, 
lasa dc verbalizacioncs y otros aspcclos no 
verbales del habla. Una importantc firea en 
la cvaluaciOn paralingUfstica ha sido la del 
juicio de emociones a partir del discurso con 
"filtraciOn del contenido”. Por cjcmplo. cl 
enojo paralingUfstico percibido en la voz de 
un mddico (juzgado en cl discureo con filtra- 
ci6n de contenido) predice una efectividad 
dcflcientc cn la canalizaci6n dc pacicntes 
alcohol icos a tratamicnto. 

10. La exprcsidn facial es otra conducta no verbal 
util en la evaluaci6n. El Facial Action Coding 
System (FACS) es un enfoque sislcmdtico 
para la codificacidn de exprcsiones faciales 
a partir de videocintas cn c&mara lenta. El 
sistcma consiste dc 44 unidadcs dc accidn 
(UA) que abarcan todos los movimientos 
faciales visibles. Con el FACS, jueces en- 
irenados pueden producircalificaciones su- 
mamentc confiablcs dc las acciones faciales. 

11. El Profile of Nonverbal Sensitivity (PONS) 
cs una cvaluaci6n amplia dc la capacidad 
para pcrcibir senalcs no verbales en una 
serie de 220 scgmentos de dos segundos (en 
pclfcula o videocinta) sobrc la conducta no 
verbal de una mujer. Aunque la confiabi- 
lidad de los canalcs del PONS es baja, su 
calificacidn global es un fndicc adecuado 
de la sensibilidad a la conducta no verbal. 
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Tema 15A 

Evaluacion por computadora 
y el futuro de las pruebas 


APITU 


Computadoras en el proceso de prueba: revisidn y antecedentes 
Interprelackbn de una prueba basada en sistemas: situacidn actual 
Multimedia y realidad virtual: el nuevo horizonte de la CAPA 
Valoracidn de la interpretacidn de pruebas basada en sistemas 
Ejemplo de caso 15-1. Confianza irreflexiva en un informe del MMPI por 
computadora. 

Pruebas adaptativas computarizadas 
El futuro de las pruebas 
Resumen 

Tdrminos y conceptos clave 



in 

■mm 



lip 


En los capftulos anteriores sc ha csbo- 
zado un sinniimero dc maneras en las que sc 
utilizan las pruebas para la toma de decisiones. 
Adcmds, se ha cstablccido que las pruebas psi- 
coldgicas no s6lo se han propagado sino que 
tambidn ticnen consecuencias. Los rcsulta- 
dos dc prueba son importantes. Las conelusio- 
ncs dc las pruebas pueden justificar cl derccho 
a obtener algun pri vilegio. A1 contrario, las con- 
clusioncs dc una prueba pueden aulorizar que 


se nieguen oportunidadcs. Entonces, por mu- 
chas razones, es adccuado concluir estc libro 
con dos temas especiales relacionados con las 
repercusioncs potenciales dc las pruebas psi- 
coldgicas. En cl tema 15 A. Evaluacidn por com¬ 
putadora y el futuro de las pruebas, se revisan 
las aplicaciones actualcs dc la computacidn en 
la evaluacidn psicoldgica y despuds se anali- 
zan las cuestiones profesionales y sociales que 
surgen de esta prdctica. Este tema cierra con 
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las considcracioncs accrca del fuluro dc las 
pruebas —que cn gran medida se verdn rnol- 
deadas por las aplicaciones cada vez mas com- 
plejas de la tecnologfa inform.ltica. La malcria 
de las cuestioncs profesionalcs conlinua cn el 
tema 1SB, Cucstiones eticas y sociales en las 
pruebas. Se comicnza con una pcrspccliva ge¬ 
neral y antcccdcntcs dc la informacidn cn las 
pruebas. 

P COMPUTADORAS EN EL PROCESO 
DE PRUEBA: REVISION 
Y ANTECEDENTES 


INTRODUCCION A LA EVALUAa6N 
ASIST1DA POR COMPUTADORA 

En muchas ccntros de oricntacidn es posible 
que el clientc haga una cita con una microcom- 
putadora para cxplorar sus opcioncs de carrc- 
ra. Adem&s de una breve interaccidn con la 
rcccpcionista para programar cl horario de uso 
de la compuladora, el clicnte no nccesila inter- 
actuar con ningun otro scr humano durante todo 
cl proceso de evaiuacidn. El cscenario exacto 
diferird dc un ambiente a otro, pero podrfa pa- 
recerse al siguiente. Las instrucciones en la 
pantalla dc la computadora alientan al usuario 
a oprimir cualquier tccla. Entonccs, la compu¬ 
tadora estimula al clicnte a responder una scrie 
de preguntas sobre actividades c intcrcscs al 
oprimir teclas numeric as establecidas. Despuds 
dc terminar con el inventario, la computadora 
calcula las punluaciones naturales dc una larga 
lista dc esealas ocupacionalcs y realiza las trans- 
formaciones estadfsticas apropiadas. A conti- 
nuacidn aparece en pantalla un breve informe. 
£stc proporciona una lista de carreras que son 
las que mds se adecuan a los interests del clicn¬ 
te. Tambidn se imprime una copia para revisio- 
ncs posteriores. Se puede suponcr que el clicnte 
licne mejor informacidn acerca de opciones 
compatibles dc carrcra y, por lanto, esta en 
mayor probabilidad de elegir una profesidn sa¬ 


tisfactory. Estc cscenario cs un ejcmplo simple 
de la evaluacidn psicoldgica asistida por com¬ 
putadora (CAPA; del inglds computer- 
assisted psychological assesment), un avance 
reciente bienvenido por muchos psicdlogos pero 
tambidn criticado por otros. 

Es bicn sabido que cn la actualidad las 
computadoras ticnen amplia utilizacidn en las 
pruebas psicoldgicas. No obstante, la amplitud 
de cstas aplicaciones podrfa sorprender al lec¬ 
tor. Ademds de las aplicaciones directas como 
la prcsentacidn de preguntas de una prueba, 
calificacidn de los datos de la misma e impre- 
sion de resultados (como sc dijo antes), las 
computadoras pueden utiiizarse para: 1) dise- 
nar pruebas individualizadas que se basen cn 
rcalimcntacidn cn tiempo real durante la prue¬ 
ba; 2) interpretar los resultados dc una prueba 
segun reglas de decisidn complejas; 3) rcdac- 
tar in formes narrativos extensos y detallados y 
4) presentar las estfmulos de una prueba cn un 
formato atractivo y realista de vfdeo a travds dc 
multimedia. En dsta se tocaron todos estos te- 
mas. El tdrmino general evaluacidn psicologi¬ 
ca asistida por computadora (CAPA) sc rcficrc 
al rango complcto dc aplicaciones computacio- 
nalcs en la evaluacidn psicoldgica. La CAPA 
cs muy prometedora para la prdctica dc la psi- 
cologfa, pero tambidn presenta una variedad dc 
problemas practieos y dticos que demandan una 
considcracidn cuidadosa y atenta. Una historia 
breve sobre la CAPA serfa un buen tcldn dc 
fondo para cl andlisis dc las prcocupacioncs 
pnktieas y dlicas. 

ANTECEDENTES BREVES DE LA CAPA 

La calificacidn manual dc las pruebas psicold¬ 
gicas es tediosa, lenta y propensa al error. Por 
tanlo, los psicdlogos aceptaron fdcilmcnte la 
tecnologfa en su busqueda por mejorar la efi- 
cacia y prccisidn en las pruebas. El cmplco dc 
mdquinas de calificacidn meedmea para las prue¬ 
bas psicoldgicas, como los Strong Vocational 
Interest Blanks (SVIB), ocurrid por primera vez 
en el decenio de 1920. En 1946, Elmer Hankes 
construyd una computadora analdgica para ob- 
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icncrde manera automilica las calificaciones y 
cl perfil de la SVIB (Moreland, 1992). Para ini- 
cios del dccenio de 1960, la combinacidn de 
leclorcs dpticos y compuiadoras centrales pro- 
porciond una manera rdpida y libre de errores 
de calificar e imprimir el perfil de pruebas como 
el SVIB y cl MMPI. 

La utilizacidn de compuiadoras para obte- 
ner interpretaciones de una prucba —no sdlo 
calificaciones y perilles— pucdc raslrearse 
hasla la Clfnica Mayo a principios del deccnio 
de I960 (Swenson. Rome, Pearson y Brannick, 
1965). El grupo Mayo necesitaba un sistema 
rapido y eficaz para dctectar los problcmas psi- 
coldgicos de miles de pacicntcs medicos a tra- 
vds del MMPI. Iistos respondfan a los rcaclivos 
del MMPI en taijctas especiales de la IBM que 
la computadora podia leer con un analizador. 
El primer sistema interpretativo era burdo si sc 
le juzga por las normas actuales: 

Se escribtb un programs que califIcaba 14 esca- 
las del MMPI. las convert!a en puntuaciones 
estandar e imprimfa una serie de atirmaciones 
doscriptivas. Estas se seleccionaban de un con- 
junto de 62 afirmaciones, la mayor parte de las 
cuales se asociaban con elevaciones en las es- 
calas del MMPI. El programs tenia algunas aflr- 
maciones sobre configuraclones, pero en su 
mayor parte se ignoraban las comblnaciones de 
escalas, en las que se basa la mayor parte do la 
lileralura (Fowler. 1985). 

Las afirmaciones sobre configuraciones se rc- 
fieren a interpretaciones basadas en patrones 
cspccfficos de puntuaciones de eseala; como 
las elevaciones mas alias en dos escalas dc- 
signadas. El dxito del sistema Mayo sirvi6 de 
fmpetu para la interpretacidn basada en compu¬ 
tadora para muchas otras pruebas psicold- 
gicas. Por cjemplo, a principios del dccenio de 
I960, Piotrowski (1964) dcsarrollo un sistema 
dc interprctacidn del Rorschach por compu¬ 
tadora. El sistema para el Rorschach requena 
considerable “preprocesamiento" de parte dc 
un tecnico. Primerosecodificaban las respues- 
tas individuates segun una lista dc 320 pa- 
rametros. La interpretacion se basaba en estas 
calificaciones dc parametro y no en las respues- 
tas naturalcs. 


Para el decenio de 1970, los psicdlogos sc 
dicron cucnta dc que las compuiadoras podfan 
integrarse en todo el proccso de cvaluacidn psi- 
coldgica. Johnson y Williams (1975) dcscribie- 
ron el uso de una computadora central con 
varias terminates remotas para evaluar un pro- 
medio de 17 admisiones de internamiento psi- 
quiatrico por dfa. Por lo comun, los pacicntcs 
respondfan a las siguientes pruebas aplicadas 
por computadora: MMPI, Deck Depression 
Inventory, prueba de intcligencia, prucba de 
memoria y anteccdcntes sociales. Un entrevis- 
tador llcvaba a cabo un examen estructurado 
del cstado mental c ingresaba los datos directa- 
mente a la computadora. Esta cal ificaba las prue¬ 
bas y generaba un informc narrativo completo. 
En una serie de estudios de investigacidn, cl 
grupo Utah demoslrd que estos informes se 
gcncraban en la mi tad del tiempo y a la mitad 
del costo de las cvaluacioncs (radicionales 
(Klinglcr, Miller, Johnson y Williams, 1977). 

Para cl dccenio de 1980, la CAPA era tan 
frecucntc que casi toda prucba psicoldgica exis- 
tentc podfa interprelnr.se por computadora. Una 
cmnologfa delallada dc estos avanccs csia mis alia 
del cspcctro dc cste libro. pero en el cuadro 15-1 
se han resumido los principals hitos histbricos. 

INTERPRETACION DE UNA PRUEBA 
M BASADA EN SISTEMAS: 

SITUACI6N ACTUAL 


La interpretacion dc prueba basada en sis- 
temas (CBTI, del inglds computer-based test 
interpretation ) se refiere a la interpretaci6n dc 
la prueba y rcdaccidn del informe por compu¬ 
tadora. En la actualidad, las principales edito- 
riales de pruebas ofreccn interpretaciones por 
computadora. Estos servicios cstdn disponibles 
a travds de correo, computadoras en Ifnea con 
modem o paquetes de microcomputadora on-site. 
I-o que es mis, el mercado de pruebas y de re- 
daccidn de informes por computadora es tan 
lucrativo que se puede espernr un cnorme cre- 
cimiento en este campo en los siguientes anos. 
Butcher (1987, Apdndice A) lista 169 distribui- 
dorcs comercialcs para 1986. Conoley, Plakc y 
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Cuadro 15-1. Hitos historicos de la CAPA 


1946 Hankes desarrolla una computadora anb- 
loga para calificar el SVIB (Moreland, 
1992). 

1954 El libro Clinical Versus Statistical Predic¬ 
tion, de Meehl (1954), establece la pauta 
para la interpretaabn automatizada de las 
pruebas. 

1962 El lector 6ptico y la computadora digital 
se utilizan para callficar el SVIB y el MMPI 
y tambibn para Imprimir perfiles. (Moreland, 
1992) 

1962 El primer sistema de mterpretacion de prue¬ 
bas basado en sistemas para el MMPI se 
desarrollb en la Clinica Mayo (Swenson 
y cols., 1965). 

1964 Piotrowski publica un sistema de interpre- 
tacibn por computadora para el Rorschach 
(Piotrowski, 1964). 

Dece- Proliferan los sistemas de interpretacion 

nio de por computadora para el MMPI; Fowler, 

1960 Finney y Caldwell desarrollan sistemas 
populares (Fowler, 1985). 

1971 Se utiliza una computadora central con 
lerminales para automatizar todo el proce- 
so de evaluacibn para pacientes intemos 
en el brea psiquibtrica del Hospital de 
Veteranos en Salt Lake City, Utah (Klingler, 
Miller, Johnson y Williams, 1977). 

Dece- Se introducen las pruebas adaptativas 

nio de computarizadas (CAT); las CAT permlten 

1970 baterias llexibtes e individualizadas de 
prueba que producen un nivel dado 
de precision de medida con el menor 
numero posible de reactivos de una 
prueba. (Weiss, 1982) 


1975 Primera interpretacibn automatizada de 
una bateba de pruebas neuropsicologicas 
(Adams y Heaton, 1985). 

1979 Lachar publica un sistema interpretative 
con base actuarial para el Personality 
Inventory tor Children (Lachar y Gbowski, 
1979). 

1985 Aparece una serie especial sobre evalua- 
cibn psicolbgica por computadora en el 
Journal of Consulting and Clinical Psycho¬ 
logy (Butcher, 1985). 

1986 La American Psychological Association 
publica las Guidelines for Computer- 
Based Tests and Interpretations. 

1987 Publicaclbn del primer libro sobre recur- 
sos titulado: Computerized Psychological 
Assessment: A Practitioner’s Guide 
(Butcher, 1987) 

1994 Introduccibn a las baterias de prueba en 
multimedia; por ejemplo, en la IBM se 
utiliza una prueba en multimedia para 
evaluar las habilidades de solucibn de 
problemas reales de los posibles emplea- 
dos (Monitor de la APA, junio de 1994). 

1997 El Educational Testing Service y otros 
gigantes de las pruebas han cambiado a 
las pruebas por computadora para los 
prindpales examenes de admision, como 
la Graduate Management Admission Test 
(GMAT; Prueba de Administracibn de Ad- 
misiones para el Posgrado) y los Gradua¬ 
te Record Examinations (GRE; Examenes 
del Registro de Posgrado). 


Kemmerer (1991) sefialan que el numero de 
interprctaciones por computadora de pruebas 
psicolbgicas habfa aumentado a mas de 400 para 
1990. Casi cada mes se informa de nuevos sis¬ 
temas de pruebas por computadora en las re¬ 
vistas y peribdicos del ramo (p. ej.. Monitor de 
la APA). Las interprctaciones de prueba basa- 
das en sistemas llegaron para quedarse. 

En esta seccion se proporciona una revi- 
sibn general dc los tipos de interpretaciones de 


prueba basadas en sistemas que estbn disponi- 
bles en la actualidad. Una resena completa de 
los productos podna abarcar con toda facili- 
dad varios volumenes. de modo que el lector 
tendril que conformarse con un anblisis de ejem- 
plos diversos y representativos de la CBTI. Se 
revisaran cuatro aspectos de la CBTI: infortnes 
de calificacibn. informes descriptivos, infor¬ 
mes actuariales e informes clinicos asistidos 
por computadora (Moreland, 1992). 
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INFORMES DE CALIFICAClbN 

Los informes de calificaci6n expresan las pun- 
tuaciones, perfiles o ambos. Ademds, un infor¬ 
me de este lipo pucde incluir la graficacidn de 
pruebas de significacidn estadfslica e interva- 
Ios de confianza para las calificacioncs de una 
prueba. Por dcfinicidn, los informes dc califica- 
ci6n no incluycn tcxto o explication narrativos 
accrca dc las puntuaciones. Moreland (1992) 
analiza cl atractivo dc las informes de califica- 
ci6n: 

Estos lipos de datos hacen posIWe idenlificar a 
primera vista las calincaclones especlalmente 
signilicativas y las diferencias importantes entre 
dstas. Tambien deberian aumenlar la confianza 
del usuano en que dichas callficaciones son de 
hecho importantes. Las pruebas de significacidn 
estadistica son, sin duda, superiores a los *m6- 
todos dlnicos prSctlcos", cuando se trata de la 
interpretacidn precisa de las calificaclones de una 
prueba. Y ^quldn tiene el ttempo para calcular 
los intervalos de confianza —en especial con 
pruebas que tienen docenas de escalas? 

En la figura 15—1 sc muesta como ejemplo un 
informe dc calificacidn para cl Jackson 
Vocational Interest Survey ( Jackson. 1991). El 
lector observard que se presenta gran cantidad 
de informacidn dc una manera eficaz y con- 
densada. Esto es tfpico de los informes de cali¬ 
ficacidn. En una sola pdgina, la persona 
hipotdtica que hubicra respondido a la prueba 
se entcraria de que sus intcrescs son sumamente 
similares a las licencialuras cn humanidades. 
educacidn y negocios. En tifrminos dc adaptacidn 
laboral, sabri'a tambien que es muy compatible 
con onentadores, macstros. abogados, admi- 
nistradores y otras profesiones que tienen dn- 
fasis en las relaciones humanas. 

INFORMES DESCRIPTIVOS 

Un informe descriptivo va un paso mds alia del 
informe de calificacidn al proporcionar una 
interpretacidn breve, escala por escala, de los 
resultados de una prueba. Estos informes son 
espccialmente utiles cuando las conclusioncs 
de una prueba se comunican a profesionalcs de 


la salud mental que tienen poco conocimiento 
de la prueba cn cucstidn. Por ejemplo. la mayo- 
rfa de los psicdlogos clfnicos saben que una 
alta calificacidn en la escala dc Psicastcnia del 
MMPI significa preocupacidn e insatisfaccidn 
con las relaciones socialcs —pero otros pro- 
fesionales dc la salud mental pueden no tener 
idea del signiftcado de una elcvacidn en esta 
escala. Un informe descriptivo puede trasmi- 
tir informacidn invaluable en media pdgina o 
mcnos. En la figura 15-2 se muestra uno de los 
primeros informes descriptivos publicados. El 
lector verd que este pacicnte vardn dc 20 ados 
dc edad sc describe como tfmido, sensible, prc- 
ocupado y gravemente deprimido. Es claro que 
estd justificada la canalizacidn dc este pacicn¬ 
te mddico a un psicdlogo o psiquiatra. Este in¬ 
forme es un modelo dc sencillez y claridad. En 
comparacidn, la mayor parte de los informes 
descriptivos actualcs que se basan cn sistemas 
proporcionan detalles excesivos. Por locomun, 
el cltnico debe batallar con la lectura de varias 
pdginas de texto, a fin de extraer las caracterfs- 
ticas csenciales accrca del clicntc. 


INFORMES ACTUARIALES: PREDICCION 
CLfNICA VERSUS ACTUARIAL 

El enfoque actuarial dc la interpretacidn de una 
prueba basada en sistemas se basa cn la deter- 
minacidn empfrica de relaciones entre los resul- 
lados dc una prueba y criterios de interds. La 
naturalcza dc este enfoque puede comprenderse 
mejor en cl contexto del antiguo debate entre la 
prediccidn clfnica y la actuarial. Aquf es nece- 
saria una breve desviacidn para introducir al 
lector a los conceptos y asuntos rclacionados 
antes dc analizar los informes actuarialcs. 

Muchas interpretacioncs de prueba basa- 
das cn sistemas hacen prcdiccioncs sobre la 
persona examinada. Con frccucncia, estas se 
disfrazan cn cl lenguajc de la clasificacidn o 
el diagndslico, pero siguen siendo predicciones. 
Por ejemplo. cuando un informe de prueba 
neuropsicoldgica por computadora expresa dc 
manera tentativa un dano cerebral en un clien- 
tc, cn realidad dsta es una prediccidn implfcita 
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CASO EXAMINAIX), M 123456789 VAR CM 27-KAR-84 PJtCINA 6 


SDBJANZA COM QRUPOG IK KSTODIANieS UNTVERSITARJOS 



MUJEHES 

VARCNES 


ACRICULTURA 

-e.67 

-0.57 

(HUY BAJA) 

ARTES Y AltQOITECTURA 

-0.18 

-0.08 

(BAJA) 

AEMINISTRAClbN DE EMPRESAS 

•0.53 

♦0.65 

(HUY ALTA) 

Cl EMC I AS DE IA TIERRA Y MINERALES 


-0.72 

(HUY BAJA) 

educaci<5n 

•0.64 

•0.65 

(HUY ALTA) 

INGENIEUfA 

-0.53 

-0.61 

(HUY BAJA) 

SALUD. roue. Pf SICA Y RBCREAClbN 

-040 



DDSARROLLO HUKANO 

•0.39 

♦0.70 

(HUY ALTA) 

IflJMANIQADES 

♦0.71 

*0.77 

(HUY ALTA) 

CIENCIAS NATURALES 

-0.66 

-0.60 

(HUY BAJA) 

ENPKKMENIA 

♦0.17 



ESIUDIANTES DE MEDIC INA 

♦0.08 

-0.12 

(HUY BAJA) 

EDUCAClbN TbCNICA 


-0.43 

(HUY BAJA) 


SEMEJANZA CGN CIASIFICACIOMCS LABORA1XS 


A CONTINUAClbN SB CATALQCA LA CLASIPtCAClbN LABORAL OWE. SEGOn SB ENCONTRb. ES SIMILAR A SO PERKIL OE 
INTERESKS. UMA CALIPICACI6N POSIT1VA INDICA OUE SU PERPIL MUESTRA CIERTO CRADO DE SEMEJANZA COM 
AQUELLOS OOE YA TRABAJAN EN EL GROPO LABORAL. M1ENTRAS CUR ONA NBGATIVA INDICA PALTA BE SEMEJANZA. 


CALinCAdbM 

SEMEJANZA 

CIJJIlriCACldW LABORAL 

♦0.78 

HUY SB4&JWTH 

OR lENTAClbN/ESTUDl ANTES PERSONAL TRABAJADORES 

•0.74 

HUY SEHEJAWTE 

ENSEJiANZA Y OCUPACIONES RELACIONADAS 

♦0.74 

HUY SEMKJAMTE 

OCUPACIONES EN RKUGlbN 

♦0.71 

HUY SEHKJAMTE 

ADKINlSTRAClbN Y OCOPACIONKS RELACIONADAS 

♦0.68 

HUY SEMRJANTE 

OCUPACIONES EN LEYES Y POLtTICA 

♦0.60 

HUY SEHEJAWTE 

ACMINISTRAClbN DE WCRSCNAL/RBCORSOS HOMANOS 

♦0.57 

SIMILAR 

OCUPACIONES EN BIENESTAR SOCIAL 

♦0.55 

SIMILAR 

OCUPACIONES KN CIENCIAS SOC1ALES 

♦0.55 

SIMILAR 

OCOPACIONKS EN ENSEftANZA PREESCOLAR Y PRINARIA 

♦0,50 

SIMILAR 

OCUPACIONES EN VENTAS 

♦0.50 

SIMILAR 

OCUPACIONES EN MERCADBO 

•0.49 

SIMILAR 

SEKVICIOS SEEREIARIALES 

♦0.48 

SIMILAR 

LABORES OK RHIACCldN 

♦0.44 

SIMILAR 

OCUPACIONES EN CONTADURlA. BANCA Y FINANZAS 

♦0.05 

NEUITO 

OCUPACIONES DE SEKVTCIO 

♦ 0.03 

NEUIRO 

OCUPACIONES EN LA MUSICA 

♦0.02 

NBJ1MO 

OCUPACIONES De ENSAMBLADO-lNSTRUMBrrOS Y PBCUFSQS ITOOJCTOS 


Figure 15-1. Un informe de calificacidn para la Encuesta Jackson do interes vocacional. 

Fuente: Reproducido con autorizacibn de Jackson. D. N (1991). Jackson Vocational Interest Survey Manual (3a. 
ed.). Port Huron, Ml: Sigma Assessment Systems, Inc. (800) 265-1285. 










r 


Temas y cuestiones especlales en las pruebas • 669 


CALiriCACidN 

SEXEJANZA 

clasificaciOn laboral 

-0.30 

NKUTRO 

OCU PAC I ONES EN EL BSPBCTACULO 

-0.24 

NKUTRO 

OCUPACXONES EN ANTES PUBLIC1TARIAS 

-0.35 

DIFEKENTE 

OCU I'AC I ONES EN SERVICIOS D8 PROTECClbN 

-0.38 

DIFERENTE 

AORICULTUHA 

-0.39 

DIFEKENTE 

OPIC1ALES NILITARBS 

-0.41 

DIKERENTE 

OCUPAC t ONES EN BELLAS ARTES 

-0.58 

DIFERENTE 

OCUPACIONES EN OEPORTES Y RBCREACIbN 

-0.59 

DIFEKENTE 

KATKmXTICAS Y LABOR ES RELACIONAOAS 

-0.62 

HUY DIFEKENTE 

KAQO1NARIA/NECANICA Y TRABAJOS RELACIONADOS 

-0.63 

HUY DIFERENTE 

TRABAJOS EN SERVICIOS DE SALUD 

-0-65 

HUY DIFEKENTE 

OCU PACI ONES EN CIENCIAS PlSlCAS 

-0.65 

HUY DIFERENTE 

CONSTRUCCr6 n/OHREROS CALIPICADOS 

-0.68 

HUY DIFERENTE 

OCUPACIONES EN DIAGNOSTIC*) Y TRATAMIENTO MEDICO 

-0.71 

HUY DIFERENTE 

TRABAJADORBS EN INCENIBRIA Y APOYO T6CNIC0 

-0.76 

HUY DIFERENTE 

CIENCIAS BlOLbCICAS 


Figure 15-1. (continuacion). 


que puede confirmarse o descartarse mediantc 
criterios externos como una exploracidn cere¬ 
bral o una consulta neurologica. De la misma 
manera, cuando un informc del MMPI-2 basa- 
do en sistemas proporciona un diagndstico ten¬ 
tative de canalizacidn clfnica, segun criterios 
del DSM-IV, dsta tambicn cs una prcdiccidn que 
puede validarsc o invalidarsc a travds de crite¬ 
rios externos como una entrevista clfnica inten- 
siva. Un ejemplo final: cuando un informc de 
selection CPI por sistemas para candidalos a 
ingresar a la poliefa advierte que un solicitantc 
tendril una adaptacidn deficicnte dentro del sis- 
tema judicial, esto tambicn constiluye una pre- 
diccidn que puede rcsullar correcta o incorrecta 
a travds de una inspcccion de los registros de 
personal en una fccha posterior. 

El cmplco de computadoras para la prcdic- 
cidn basada en pruebas dcstaca una dislincidn 
esencial que se conoce como juicio clfnico 
versus juicio actuarial (Dawes, Faust y Meehl, 
1989; Garb, 1994; Meehl, 1954; 1965, 1986). 
En cl juicio clinico, la persona que toma la 
decision procesa la informaci6n dentro de su 
cabeza para diagnosticar, clasificar o predeeir 
la conducta. Un ejemplo es el psic61ogo clfnico 
que uliliza su experiencia, intuicitln y conoci- 


mientos acaddmicos para delcrminarsi un per- 
Fil del MMPI indica o no la presencia de psico- 
sis. list a conslituye una catcgorfa amplia que 
incluye graves trastornos mentales que con I're- 
cucncia se caraclerizan por alucinacioncs, deli- 
rios y trastornos del pensamiento. Asf, la 
prcdicci6n (o no) de psicosis de parte de u i 
clfnico puede validarse contra criterios exter¬ 
nos como enlrevistas detalladas. 

En cl juicio actuarial, sc utiliza una fdrmu- 
la dcrivada empfricamcntc para diagnosticar, 
clasificar o predeeir la conducta. Un ejemplo 
es el psic6logo clfnico que sdlo ingresa las ca- 
lificacioncs de una prueba en una formula ba¬ 
sada en la investigacidn para determinar si un 
perfil del MMPI indica o no la presencia de psi¬ 
cosis. La prcdiccidn actuarial tambidn puede 
validarse contra criterios externos adecuados. 

La cseneia del juicio actuarial es cl desa- 
rrollo cuidadoso y posterior utilizacidn de una 
formula con base cmpfrica para el diagndstico, 
clasificacion o prcdiccidn de la conducta. Un 
tipo cornun de f6rmuia actuarial cs la ecuacion 
de regresidn, en la que las calificaciones de una 
subprueba se combinan en una suma lineal pon- 
dcrada para predeeir un criterio relacionado. 
Pero otros enfoques estadfsticos tambidn pue- 
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Sexo Masculino EducackSn 20 Edad 34 aAos Estado CMI: Casado Pactenleexlemo 

Clave det MMPI 27-5U064-391 l-Klfl 

D 2 Gravemente deptimido. preocupado. ktdaoso. preumlsta 

Pt 7 Rigido y mebculoso Inquielo y aprensivo Insatislecho con telaclonns sociales. Probablemenle muy (ellgioso y morallsta 

Ml 5 Probablemante sensible e idealists con elevados mtereses estdticos, culturales y artfsticos 

Es 8 Tlende hacia iniweses abstractos como la dencia, filosolla y rellgidn 

Is 0 Probablemenle retraido y tlmido en sltuaciones sociales 

Pa 6 Sensible Atento a las oplruones de los demas 

Op 4 independlente y un tanto inconlorrrasta 

Hi 3 

Ma 9 Nivel normal de energia y actrvidad 

Hs 1 Numero de slntomas t Isicos y preocupacidn con lundones corpora les bastante lipioo de pacientea dlnicos 
Considerese una valoraddn psiquiSIrica 


Flgura 1S-2. Inform© descriptlvo para el MMPI de la Clinica Mayo. 

Fuente: Reproducido con autonzacion de Dahlstrom, W. G., Welsh, G, S. y Dahlstrom, L E. (1972). An MMPI 
handbook. Volume 1: Clinical interpretation (ed. rev.). Minneapolis, MN: University of Minnesota Press. Copyright © 
1960. 1972 de la Universidad de Minnesota. 


den funcionar de manera apropiada para la toma 
dc decisiones, incluyendo simples puntuacio- 
nes de cortc y diagramas de flujo basados en 
reglas. Por supuesto, las reglas cstadfsticas se 
prestan para ponerlas en prdctica en una compu- 
tadora, de modo que es adecuado analizar el 
juicio clinico versus cl actuarial en esta seccion 
sobre inlcrprctacidn por computadora. 

Aunque las computadoras facilitan cl uso 
del mctodo actuarial, es necesario enfatizar que 
“actuarial" y "computarizado” no son sindmmos. 
Para ser realmente actuarial, la intcrpretacidn 
de una prucba debe ser automdtica (espccifi- 
cada de antemano o con base en una rutina) 
y debe fundarse en relaciones establccidas a ni- 
vel empi'rico (Dawes, Faust y Meehl, 1989). Si 
un programa de cdmputo incorpora dichas re¬ 
glas automdticas, con base cmpfrica, para la 
toma de decisiones, entonccs sc csld hacicndo 
una prediccidn actuarial. Por el contrario, si un 
programa de cbmputo incorpora el pensamien- 
to y juicio de un ciinico —no importa qud tan 
sabia pueda ser esa persona— entonces se esid 
realizando una prediccidn clfnica. 

Meehl (1954) fue el primero en presentar 
la cuestidn del juicio clfnico versus el actuarial 
ante un amplio grupo de cientfftcos sociales. 
Este autor expresd la cuestidn con una senci- 


llcz pura: “^Cudndo debemos utilizar nuestra 
cabcza en vez de la fdrmula?”. Considdrcsc este 
problema practico con base en los resultados 
del MMPI. La Neurosis es un tdrmino diag- 
ndstico anticuado (aunque todavfa se utiliza) 
que se reficrc a una forma mds leve de trastor- 
no mental en cl que predorrunan sfntomas dc 
ansiedad y disforia. Como se senald antes, la 
psicosis es una forma mds grave de trastomo 
mental que puede incluir alucinaciones, dcli- 
rios y trastomos del pensamiento. El diagnbsti- 
co diferencial entre estas dos clases amplias de 
trastorno mental es importante. Con frecuen- 
cia, las personas con neurosis responden bien a 
la psicotcrapia individual, mientras que un 
pacicnte con psicosis puede requerir dc pode- 
rosos fdrmacos anlipsicdticos que produced 
efectos secundarios adversos. ^Cudl es supe¬ 
rior para la toma de decisiones diagndsticas con 
base en el MMPI, la mente de un psicdlogo bien 
entrenado o una f6rmula apropiada basada 
en investigacidn previa? Mds adelante se re- 
gresard a este asunto. 

Meehl (1954) cspecificd dos condiciones 
para una comparacion justa entre cstos dos en- 
foques contrastantes para la toma de decisio¬ 
nes. Primero, ambos mdtodos deben basar los 
juicios en los mismos datos. Por ejemplo, cuan- 
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I do sc compara at clfnico experimentado contra 
una ecuacidn actuarial, ambos cnfoques debe¬ 
rfan hacer pronosticos para el mismo conjunto 

I dc pcrfilcs del MMPI y para dsos. En scgundo 
lugar, sc debcn cvitar las condiciones quc pue- 
dan inflar de manera artificial la prccisidn del 
cnfoque actuarial. Por ejemplo, la ecuacidn 

I actuarial debe obtcnerse dc una muestra initial, 
antes de la comparacidn con la toma de deci¬ 
siones por metodos clfnicos en una nueva mues¬ 
tra de perfiles del MMPI. De otro modo, las 

I reglas de decisidn actuarial se beneficiardn dc 
las relaciones alcatorias entre variables y pro¬ 
ducing una tasa falsamentc alta dc decisioncs 
correctas. 

Cuando se satisfacen las condiciones para 
una comparacidn justa entre los cnfoques clf¬ 
nico y actuarial en la toma de dccisiones. el ul¬ 
timo metodo resulta superior en casi todos los 
casos. El cnfoque actuarial es claramente me- 
jor para la tarea citada antes —el diagndstico 
diferencial entre neurosis y psicosis a partir del 
MMPI. L. R. Goldberg (1965) determind quc 
una simple suma lineal de las calificaciones dc 
eseala del MMPI resultaba en 70% de clasifi- 
caciones correctas, mientras quc los psicdlogos 
con doctorado promediaron sdlo 62%, donde 
cl mejor psicdlogo entre todos ellos logrd 67% 
de decisiones correctas. La regia de decisidn 
que derroto a todos los contendientcs humanos 
fue: si la suma de puntuacioncs T en L + Pa + 
Es - Hi - Pt supera a 44, entonces diagnosticar 
psicosis; dc otra manera diagnosticar neurosis.* 
Dawes, Faust y Mcehl (1989) citaron ccr- 
ca de 100 estudios comparativos en las cien- 
cias socialcs. En casi todos los casos, cl mdtodo 
actuarial iguald o superd al mdtodo clfnico, en 
ocasiones de manera sustancial. La investiga- 
cion de Lcli y Filskov (1984) es tfpica dc este 
tipo de rcsultados. Estos autores estudiaron cl 
diagndstico de disfuncidn cerebral progresiva 
con base en pruebas neuropsicoldgicas. Se apli- 
cd una regia de decisidn actuarial obtenida de 
un conjunto de casos a una nueva muestra con 


* En forma respectiva, los nombres complctos dc cstas 
escalas son L (eseala dc validez), Paranoia. Esquizo- 
frenia. Histcria y Psicastcma. 


83% de identificacidn correcta. Al trabajar 
precisamcnte con los mismos datos dc praeba, 
grupos dc clfnicos inexpertos y expertos iden- 
tificaron de manera correcta sdlo a 63 y a 58%, 
respectivamcnte, de los nuevos casos. El lector 
verd el hccho perturbador y vergonzoso de que 
la experiencia no mejord las tasas de dxito para 
esta tarea de toma de decisiones por mdtodos 
clfnicos. 

La ieccidn a aprender de estos trabajos es 
que los informes narrativos computarizados 
deberfan incorporar mdtodos actuarialcs, siem- 
pre que sea posible. Por ejemplo, los informes 
generados por computadora deberfan emplear 
las fdrmulas actuariales existentes para deter- 
minar la probabilidad dc diversos diagndsticos 
psiquidtricos, en vez dc dependcr dc la Idgica 
programada de un clfnico experto. Por desgra- 
cia, como el lector descubrird a conlinuacidn, 
la mayor parte dc los informes narrativos por 
computadora tienen una base clfnica —lo cual 
hace surgir dudas sobre su validez. 

INTERPRETACION ACTUARIAL: 

ENFOQUE DE MUESTRA 

Sines (1966) definid la interprctacidn actuarial 
como aquella que se basa en “la dctcrminacidn 
cmpfrica de las regularidades que pueden exis- 
tir entre los datos cspecfficos de una prueba psi- 
coldgtca y caracterfsticas importantes, externas 
a la prueba, dctalladas de manera clara en tdr- 
minos sociales, clfnicos o tedricos acerca dc la 
persona sometida a prueba". En otras palabras, 
las afirmaciones en una interpretacidn actuarial 
no se obtienen de las conjeturas o saber clfni¬ 
co; se basan en las conclusiones especfficas y 
cuantificadas dc la invcsligacidn. 

Debido al esfuerzo de invcsligacidn que se 
rcquicre, los enfoques actuariales en la inter¬ 
pretacidn de pruebas basadas en sistemas son 
pococomuncs. Los primeros sistemas actuariales 
se basaron en el MMPI (p. ej., Gilberstadt y 
Dukcr, 1965; Marks y Seeman, 1963). Recien- 
temente, se ban aplicado sistemas de interpre¬ 
tacidn actuarial al Personality Inventory\for Children ; 
PIC (Invcntario dc Personalidad para Ninos; 
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Lachar y Gdowski, 1979; Lachar, 1987), al 
Marital Satisfaction Inventory (Snyder, Lachar 
y Wills, 1988) y al Inventario psicologico de 
California (Gough, 1987). Un cjemplo espeef- 
fico aclarard csle metodo. 

Los autores del Personality Inventory for 
Children (PIC) han producido un sistema ejem- 
plar para la intcrpretacidn actuarial por compu- 
tadora que se describira con propdsitos 
ilustralivos. El lector rccordari del capftulo 
anterior que el PIC es un inventario de cier- 
to-falso que responde uno de los padres, o la 
persona cncargada del menor, acerca dc la con- 
ducta del nino. Con base cn estas rcspuestas, 
se produce un pcrfil dc puntuacioncs T (me¬ 
dia de SO, DE de 10) para cuatro escalas de 
validcz (p. cj., Defeasividad), 12 escalas clinicas 
(p. cj., Dclincuencia) y cuatro escalas factoria- 
les (p. ej., Incompetencia social). En total, sc 
hace un informe de puntuacioncs T para 20 es¬ 
calas del PIC. Por supuesto, aqudllas mas alias 
indican mayor probabilidad dc psicopatologfa. 

La interpretacidn actuarial del PIC depen- 
de de corrclacioncs cmpfricamcntc derivadas 
entre las escalas individuates y criterios impor- 
tanles ajenos a la prueba. Los individuos de in- 
vestigacidn del estudio dc Lachar y Gdowski 
(1979) eran 431 ninos canalizados a una ala- 


reada ch'nica educativa. Como parte del procc- 
so dc cvaluacidn dc cada nino, los miembros 
del personal, padres y macstros respondicron a 
un amplio cucslionario que listaba 322 afirnia- 
cioncs descriptivas relacionadas con la conducta 
y otras variables. Ademas, los padres o cncar- 
gados respondicron al PIC. 

En la primera fase del estudio actuarial, se 
correlacionaron las 322 afirmaciones descrip¬ 
tivas con las 20 escalas del PIC para idenlificar 
correlatos significativos porcscala. En una se- 
gunda fase, se analizaron a mayor profundidad 
los correlatos significativos para determinar la 
rclacion entre las afirmaciones descriptivas y 
los rangos dc puntuacidn T cn las escalas del 
PIC. El resultado dc cstc csfuerzo prodigioso 
fuc una scric de tablas actuariales no muy dife- 
rentes dc aqucllas que utilizan las companfas 
de seguros para predecir la probabilidad de cn- 
fermedad, muerte, accidentcs y similares con 
base cn datos dcmogr$ficos dc poblacidn, como 
edad, sexo y lugar de residencia. En el cuadro 
15-2 se presentan algunos cjemplos dc los 
correlatos actuariales dc la Escala de Dclincucn- 
cia o DLQ. 

Las tablas actuariales captan un cumulodc 
informacidn util para la prdctica clfnica. Considd- 
rense a dos ninos hipotdticos dc 12 ahos de edad, 


Cuadro 15-2. Tasas de ocurrencia de descriptores actuariales de la Escala de 

delincuencia del PIC 



Tasa 

base* 



Rangos de puntuacidn T 



Descriptor 

30-59 

60-69 

70-79 

80-89 

90-99 

100-109 

110-119 

>120 

Se niega a ir a la 

30 

18 

26 

23 

33 

36 

33 

42 

38 

cama 

Mionte 

62 

44 

36 

48 

73 

71 

79 

90 

91 

Utiliza sustancias 

12 

0 

2 

6 

7 

11 

18 

32 

53 

prohibidas 

Rechaza la escuela 

40 

16 

26 

40 

42 

50 

47 

56 

67 

Involucrado con la 

17 

0 

4 

6 

10 

21 

19 

58 

63 

policla 


■ Porcentaje de todos los nirvos en los que se calMIcd la presencia de la caracterlstica 

Nota: Eslos dnoo descrlplores sOio son una moeslra represenlatrva de los 51 correlatos actuariales de la Escala de delincuencu 
Fuonlo: Material del Actuarial Assessment ot Child and Adolescent Personality An Interpretive Guide lor the Personality Inventory lor 
Children Profile copyright01979 de Western psychological Services Reproductdo con aulorizatidn del editor, Western Psychological 
Services, 12031 Wiishire Boulevard, Los Angeles, CA 90025, EUA 
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Jimmy y Johny, cada uno dc ellos canalizado a 
un clfnico por cl mismo problcma: bajo rcndi- 
miento cscolar. Como parte del proccdimiento 
inicial. cl clfnico le pidc a cada una de las madras 
quc rcsponda al PIC. Supongase que la califi- 
cacidn de Jimmy cn la Escala dc Dclincuencia 
o DLQ cst3 sumamcntc clcvada, con una pun- 
tuacidn 7" dc 114, micntras que John obticnc 
una puntuacidn T de 54, dentro del rango pro- 
medio. Con base cn cstas calificacioncs, el clfnico 
sabn'a la probabilidad —lisiada a con(inuaci6n 
como porcenlajes— de que ciertas descripcio- 
nes conduclualcs se apliquen a cada nino: 

Jimmy Johny 
(DLQ = 114) (DLQ = 54) 


Se niega a ir 

42% 

18% 

a la cama 

Miente 

90% 

44% 

Utiliza drogas 

32% 

0% 

Rcchaza la 

56% 

16% 

escucla 

Problemas con 

58% 

0% 


la policfa 

El lector reconocerd dc inmediato que Jimmy 
encaja cn un patrdn dc (rastorno conductual 
gcncralizudo, micntras quc Johny parece tener 
pocos problemas de conducla. En cl caso del 
primero, cs mas probable que el bajo rendimien- 
to sea secundario a un patrdn de conducta anti¬ 
social, micntras que cn el caso de Johny, cl 
clfnico debe buscar en otra parte para compren- 
der el fracaso en la cscucla. Por supuesto, esla 
cs solo una pequeha (raceion dc la informacidn 
quc se tendrfa disponible de una interpretacidn 
actuarial por computadora para cl PIC. En un 
informc complcto, cl clfnico rccibirfa los datos 
cstadfstieos y las afirmacioncs narrativas perti- 
nentes para las 20 escalas completas del PIC. 

INFORMES CUNICOS ASISTIDOS 
POR COMPUTADORA 

En un informe clfnico asistido por computado¬ 
ra, las afirmacioncs interpretativas asignadas a 


los rcsultados dc una pmeba sc basan en el juicio 
de uno o m4s clfnicos expertos. Estos formali- 
zan sus procesos dc pensamiento y desanollan 
reglas aulomatizadas dc dccisidn que despuds 
se traducen a un eddigo de computadora. Este 
metodo dificre de mancra crucial del enfo- 
que actuarial asistido por computadora, en el que 
las afirmaciones interpretativas se basan estric- 
tamente en las conclusiones de investigacidn 
formal. A nivcl superficial, los dos enfoques 
pueden parecer idcnticos, en cl sentido de que 
cada uno se basa en reglas y es aulomatico. La 
diferencia liene que vercon el origen de las re¬ 
glas: invcstigacidn empfrica (enfoque actuarial) 
versus juicio clfnico (enfoque clfnico). 

Aunquc en general los clfnicos icconoccn 
la superioridad del mdtodo actuarial, cxiste una 
ventaja significativa del enfoque clfnico asisti¬ 
do por computadora. 6sta cs quc cl enfoque 
clfnico se puede disenar para interpretar todos 
los pcrfilcs dc una prueba, micntras quc algu- 
nos scran imposibles de interpretar por medio 
del enfoque actuarial. La dcsalentadora verdad 
acerca de los sistemas actuarialcs, tipo “libro 
de cocina”, dirigidos a la interpretacidn de prue¬ 
bas es que, en general, la tasa de clasificacidn 
desciende de mancra vertiginosa cuando se uti- 
liza un sistema en un nuevo entomo. La tasa dc 
clasificacidn sc rcficre al porccntaje de resulla- 
dos de una prueba que encaja en las complcjas 
reglas de clasificacidn del perfil necesarias para 
la interpretacidn actuarial. Por ejcmplo, en el 
sistema actuarial para cl MMPI de Gilbcrstadt 
y Duker(1965), la clave de perfil 1-2-3 se defi¬ 
ne por las siguientes reglas para las escalas Hs 
(Hipocondriasis), D (Dcpresidn), Histcria (Hi) 
y L, F, K (validcz): 

1. Hs, D y Hi por encima de 7 = 70 

2. Hs > D > Hi 

3. Ninguna otra escala por cncima de T- 70 

4. L < T de 66, F < 7de 86 y K < 7de 71. 

Es frecucnte que las personas que producen 
este tipo de perfil en el MMPI sufran de 
sobrcrreac-tividad psicofisioldgica, por no men- 
cionar una multitud de otras caractcrfsticas con- 
firmadas a nivel empfrico. Por supuesto, existen 
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varias claves dc perfil adicionales. cada una de 
ellas defi-nida por un conjunto de reglas conv 
plejas dc dccisibn y acompaiiadas por una des- 
cripcibn claborada, con base actuarial, dc la 
pcrsonalidad y psicopatologfa. Una conclusibn 
tfpica es que un sistema actuarial asistido por 
compu-tadora que se desarrolla dentro de una 
poblacibn de clientes serd capaz de interpretar 
hasta 85% de los perfilcs dc una prueba que se 
encuentrcn en esc entorno. No obstante, cuan- 
do cl sistema actuarial se aplica a un nueva po¬ 
blacibn de clientes, quizd 50% dc los perfilcs 
de una prueba encajardn cn las reglas de deci- 
si6n. Esto significa que cerca dc la mitad dc 
dichos perfiles no encajan en las reglas. Cuan- 
do mucho, estos clientes recibirdn una inter- 
pretacibn superficial, eseala por eseala, en vez 
dc una intcrprctacibn actuarial mds compleja 
basada cn las claves de perfil. En casi todos los 
estudios sobre la interpretacibn actuarial se ob- 
serva el problema de la reduccibn en la tasa dc 
clasificacibn (Moreland, 1992). 

Los informes clfnicos asistidos por com- 
putadora tienden a ser extensos y detallados. 
Ilenos de calificaciones de escalas, indices de 
rcactivos y grdficas. Por supucsto, estos infor- 
mes incluycn varias pdginas de informe narra- 
tivo, que en general se frasea en tbrminos dc 
hipbtesis en vez de conclusiones confirmadas. 
El informe mds corto dc estc tipo cs de cerca 
de seis pdginas (p. ej., el Karson Clinical Report 
[Informe Clinico Karson] para el 16FP), mien- 
tras que los mds grandes pueden constar de 10 
o 20 pdginas (p. ej., las interpretaciones para el 
MMPI-2). 


MULTIMEDIA Y REAUDAD 
VIRTUAL EL NUEVO HORIZONTE 
DE LA CAPA 


Con los recientes avances en tecnologfa, la 
microcomputadora modema ha abierto un mun- 
do nuevo para la evaluacibn psicolbgica. La 
computadora comun de escritorio es capaz aho- 
ra de presenter segmentos de video que poseen 
la claridad visual de la telcvisibn. Los sistemas 


estereo interconstruidos producen una salida 
exquisita de audio, incluyendo cl habla huma- 
na sintetizada que parece verdadcra. Con los 
accesorios de CD-ROM, es posiblc cl acceso 
instantdneo a enormes almaccnes de infornta- 
ci6n —incluyendo imdgenes fijas, segmentos 
de video en vivo, musica, tablas, grdficas, ani- 
macibn. En forma colectiva, estas capacidades 
se conoccn como multimedia— en especial 
cuando se les emplea en aplicaciones interac- 
tivas y cducativas. El multimedia es un nuevo 
horizonte dc la evaluacibn psicolbgica asistida 
por computadora. El otro cs la realidad virtual, 
que se analizard mds adclante. 

En la IBM, los investigadores han desarro- 
Ilado una prueba computarizada en multimedia 
que puede cmplcarsc para evaluar a los solici- 
tantes de trabajo para puestos dc manufactura 
(Monitor dc la APA, junio dc 1994). El aspecto 
unico de esta prueba es la naturalcza de los es- 
timulos. En vez dc sblo describir una situacibn 
de trabajo, la computadora con multimedia re- 
presenta la csccna cn si. A medida que el so- 
licitantc observa las diferentes vihetas, la 
computadora congela la imagen en momentos 
cruciales y le pregunta al candidato qub debc- 
ria hacer en esa situacibn. Las escenas propor- 
cionan una sensacibn sumamente realista, lo 
cual aumenta la validez de facie de la prueba. 
Los sistemas multimedia ofrecen proporcionar 
una cvaluacibn mds precisa del desempeno real 
de las personas en cl puesto que las pruebas de 
ldpiz y papel. Las pruebas en multimedia son 
cspecialmente buenas para detectar la capaci- 
dad de la persona examinada para enfrentarse 
con problemas complejos y realistas, como la 
toma dc decisiones bajo presibn de tiempo o 
la solucibn de conflictos en el trabajo. 

Otra aplicacibn potencial de los sistemas 
multimedia es la seleccibn de personal para in- 
greso como agentes de la poliefa. El personal 
que se encarga del cumplimiento dc la ley debe 
tener capacidad dc observacibn y valoracibn. 
que pueden evaluarsc de mancra realista con 
estfmulos en video. Por ejemplo, una cvalua¬ 
cibn podria consislir, en parte, dc cintas de video 
acerca de testigos cn una csccna delictiva. Se 
podrfa pedir a los candidatos a ingresar a la 






_ 

policfa que determinaran la veracidad dc los tes- 
tigos y que extrajeran conclusiones acerca del 
dclito con base en sus poderes de observacidn 
(Monitor de la APA, junio dc 1994). Esle ejcm- 
plo —hipotetico en la aclualidad— ilustra el 
potencial de multimedia para revolucionar la 
cvaluacidn psicoldgica. 

Por ultimo, dcberfa mencionarsc que las 
prucbas en multimedia son casi independicn- 
tes del lcnguajc. Los candidatos talentosos a un 
cmpleo, que no posccn bucnas capacidades de 
Icciura o escritura, pero que ticnen habilidadcs 
practicas para el puesto, pueden idcntificar- 
se por pruebas en multimedia. Para algunos 
emplcos, los sistemas multimedia pueden ser 
mils justos que el enfoque dc Idpiz y papel. 

Por ultimo, un enfoque muy rcciente de 
tecnologfa avanzada para la cvaluacidn con base 
en computadoras merece un comcntario breve. 
En la realidad virtual, el participantc utiliza un 
par dc galas que transmiten imfigenes realistas, 
tridimensionalcs, dc un ambiente simulado. Me- 
diante la manipulacidn de mecanismos sencillos 
de control, cl participante puedc navegar a tra- 
ves del ambiente aunque permanezea en un solo 
sitio. Por supuesto, cl ambiente visual, conoci- 
do como realidad virtual, se basa en complejos 
estfmulos por computadora. Las nuevas herra- 
mientas de evaluacidn que utilizan la reaiidad 
virtual se encuentran en sus primeros anos, pero 
parecen muy prometedoras. Por ejemplo. cs po- 
siblc valorar la imagen corporal de un clicntc 
por medio de la realidad virtual, como se des- 
ciibe en un reciente artfculo, en una nueva re¬ 
vista intitulada Cyber Psychology and Behavior. 

valoraci6n de la 
interpretaci6n de pruebas 

: BASADA EN SISTEMAS 


Las pruebas por computadora tienen claras ven- 
tajas, pero tambien algunas desventajas poten- 
cialmcnte graves en comparacidn con el enfoque 
clmico tradicional de pruebas psicoldgicas. Aquf 
se ofrece una breve revisidn que destaca tanto 
las ventajas como las desventajas de las prue- 
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bas, diagndstico y rcdaccion del informe por 
computadora. En Butcher (1987), Kramer 
(1988), Moreland (1992), Roid y Johnson 
(1998), Tallent (1987) y el numero especial del 
Journal of Consulting and Clinical Psychology, 
dicicmbrc (1985), pueden encontrarse mayo- 
res detallcs acerca de este tema. 


VENTAJAS DE LAS PRUEBAS 
Y REDACCION DEL INFORME 
POR COMPUTADORA 

Las principalcs ventajas de las pruebas por 
computadora son su rapido procesamiento, bajo 
costo, casi pcrfecta confiabilidad y complcta 
objetividad. Ademds, algunas aplicaciones de 
medicidn, como las pruebas flexibles ajustables, 
requieren del uso de las computadoras para po- 
nerlas en prdctica. Despuds sc cxploran cstos 
puntos con mayor detalle. 

En una prdctica clfnica muy solicitada. las 
demoras entre la aplicacidn de la prueba y la 
prcscntacidn del informe de consultorfa son 
comuncs y casi inevitables. Iistas no s61o dc- 
terioran la reputacidn del psicdlogo, sino que 
tambidn pueden afcctar de manera adversa el 
rcsultadodel tralamicnto para el cliente. Porejcm- 
plo, un estudiante uni versitario con una discapa- 
cidad para el aprendizaje puede requerir una 
intervcncidn inniediata, con la finalidad de evi- 
tar un desastrc acaddmico. Una demora dc dos o 
tres semanas para presentar un informe de con¬ 
sultorfa podrfa afectar, de manera indirecta, la 
difercneia entre el fracaso y el dxito en el de- 
sempefio acaddmico. Los informes por compu¬ 
tadora pueden acclerar todo cl proceso de 
consultorfa. Muchos sistemas de software pro- 
duccn informes que pueden transferirse a un 
programa de procesamiento de textos para la 
cdicidn inmediata, personalizada, con locual se 
acclcra cl tiempo dc procesamiento (p. ej.. Psycho¬ 
logical Corporation, 1994; Tanner, 1992). 

El costo es otra consideracidn en las prue¬ 
bas por computadora. Aunque no existen estu- 
dios definitivos sobre este tema, la mayorfa de 
las autoridades afirman que las pruebas psico- 
Idgicas calificadas e interpretadas por compu- 
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tadora cuestan considerablemente mcnos que 
aquellas producidas complctamcnte a traves del 
eslucrzo de un clfnico (Butcher, 1987). En 
sus cstudios sobre pruebas automatizadas cn el 
Hospital de Vetcranos cn Salt Lake City, 
Klinger, Miller, Johnson y Williams (1977)con- 
cluyeron que la computadora redujo el costo 
de las pruebas a la mitad. Con toda seguridad, 
a medida que los programas computarizados de 
pruebas se vuelvan mis elaborados y los utilicc 
un mayor numero de clfnicos, el costo por con- 
sulta disminuira de manera notable. 

La confiabilidad y objetividad conslituyen 
cl sello distintivo de las computadoras. Si sc 
supone que el software cs preciso y esti libre 
de errorcs, las computadoras simplcmentc no 
pueden cometer errores de calificacidn, como 
tampoco pueden variar sus mitodos de presen- 
tacidn del cstfmulo de un dfa para otro, ni pro- 
ducir informes narrativos diferentes con base 
cn la misma informacidn ingresada. El produc- 
to cs cl mismo sin importar las vcccs que sc 
crnplcc cl programa de computo. Lo que cs mis, 
dado que los informes por computadora sc ba- 
san cn reglas objelivas, no los distorsionan los 
efectos de halo u otros elementos de sesgo sub- 
jetivo que podrfan afcctar un informc obtenido 
por mdtodos clfnicos. Butcher (1987) dcstaca 
que los informes por computadora pueden tc- 
ncr una importancia especial en casos judicia- 
Ics, dado que sc considera que “no los ha tocado 
la mano del hombre”. £sta es una posibilidad 
fascinantc, pero quizi demasiado optimista cn 
cierto sentido. Los abogados y jueces seguirin 
teniendo el deseo de saber quidn programd el 
software , c6mo se desarrollaron las afirmacio- 
nes narrativas y demas. 

DESVENTAJAS DE LAS PRUEBAS 
Y REDACCION DEL INFORME 
POR COMPUTADORA 

Considerese el siguiente ejemplo, hipotdtico 
aunque realista y que probablemente ocurre en 
muchas ocasiones. El medico de un hospital 
canaliza a un paciente mddico diffcil al servi- 
cio psicoldgico para que se haga una evalua- 


cion dc pcrsonalidad. Sc lleva al paciente al cen¬ 
tra dc pruebas, donde una recepcionista lo sienta 
en una mesa frente a una microcomputadora. 
Las instruccioncs que aparcccn cn el monitor 
dc 6sta piden que se responda a una scric de 
autoafirmacioncs ciertas o falsas al oprimir la 
tecla C o F. El paciente responde al inventario 
objetivo dc pcrsonalidad y se Ic regresa al ser- 
vicio medico. Scgundos despues, de la impre- 
sora surge un informe narrativo basado en las 
respuestas del paciente. El psicdlogo consultor 
revisa dc manera breve cl informc y despues lo 
cnvfa (sin firmar) al medico a traves de correo 
interno. El informe es atraclivo, con una apa- 
riencia prccisa por su impresidn cn liser y con 
un resumen grifico dc las escalas en la primera 
pigina. Loquees mis, la narrativa suena valida 
y se ve como si la hubiera corregido un cscri- 
tor profesional (de hecho, asf file). El m6dico 
se siente impresionado y adopla el informe como 
la verdad absoluta, tomando decisiones dc tra- 
tamiento que se basan en la evaluacidn dc pcrso¬ 
nalidad. 

Este esccnario ilustra un dilema escncial dc 
las pruebas y redaction de informes por compu¬ 
tadora: dstas pueden dominar de tal manera cl 
proceso de prueba que sc rclcga al psicdlogo 
clfnico a un papel de mero recepcionista —o se 
le elimina por complcto del proceso de evalua- 
ci6n. Aunque la mayorfa de los psicdlogos re- 
conocen que las computadoras son una adicidn 
bienvenida a la prictica dc las pruebas psicold- 
gicas, los crfticos han presentado una seric de 
dudas inquietantes acerca dc las priclicas re- 
cicntes de cvaluacidn como la presentada an¬ 
tes. La mecanizacidn del proceso de prueba 
debido al uso dc computadoras hacc surgir cues- 
tiones practicas, legalcs, dlicas e importantes 
que merecen una revisidn cuidadosa. 

En general, los escepticos no atacan la prac- 
lica de procesar por computadora la aplicacidn 
y calificacibn mecdnicas dc las pruebas; estas 
aplicaciones se consideran como usos eficicn- 
tes y apropiados de la tecnologfa modema. No 
obstante, incluso los defensores mis fervientes 
reconocen la necesidad de investigar la equi¬ 
valence prueba-forma cuando se adapta una 
prueba existente a su aplicacion por compu- 
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ladora. En particular, los profesionalcs no dc- 
beri'an suponcr quc la adaptacidn en compu- 
(adora y la versidn original dc una prucba 
produccn rcsultados identicos. La cquivalcncia 
es una cuestidn cmpfrica quc debc demostrarse 
con la investigacidn apropiada. En cl caso de 
la mayor parte dc las pruebas, puedc demos¬ 
trarse la equivalence, pero eslc no es un asun- 
to quc deba darsc por sentado (Lukin, Dowd, 
Plakc y Kraft, 1985; Schuldbcrg, 1988). 

Algunas pruebas no conservan cquivalcn¬ 
cia dc calificacioncs cuando se les traduce a un 
sistema dc edmputo. La Prueba de Categorfas 
(Category Test-, CT), de la Halstead-Reium 
Neuropsychological Battery, es un caso a propd- 
sito. En una comparacidn de las versiones 
por computadora y cstandar de la Prucba de 
catcgorfas con pacientes en rehabilitacidn. 
Berger, Chibnall y Gfeller (1994) encontra- 
ron una enorme difercncia en la tasa de errores 
en dos grupos de personas que tenfan antece- 
dentes cquivalcnlcs: un promedio dc 84 erro¬ 
res para la CT por computadora contra un 
promedio de 66 errores en la CT cstindar. En 
apariencia la CT por computadora es niucho 
mas diffcil que la versidn estindar, lo cual sig- 
nifiea que deben desarrollarse normas indepen- 
dientes para su interpretation. Tambidn se han 
informado difcrencias mucho mas pequeitas 
entre las versiones por computadora y cstdndar 
del MMPI, donde las calificacioncs de la ver- 
si6n por computadora tienden a subestimar (li- 
gcramente) aquellas basadas en cl protocolo 
normal (Watson. Thomas y Anderson, 1992). 

El punto dc atencidn principal de la con¬ 
troversy sobre interpretation de pruebas por 
computadora es la redaction computarizada del 
informe. Varios expertos dcstacados en prue¬ 
bas psicol6gicas han expresado graves dudas 
accrca de la prictica rutinaria de automalizar 
los informes narrativos que deben acompahar 
a toda evaluation clfnica (Faust y Ziskin, 1989; 
Lanyon, 1984; Matarazzo, 1986,1990; Tallent, 
1987). Las principales prcocupaciones incluyen 
las siguientes: 

• Las pruebas psicoldgicas por computadora 
constituyen un sustituto pobre para la cvalua- 
ci6n psicoldgica. 


• Es poco comun que los informes narrativos 
por computadora sc validcn antes de utilizarsc. 

• Las interprelaciones clfnicas psicoldgicas por 
computadora no van firmadas. 

Mas adelante se matizan estos puntos. 

Matarazzo (1986) ha enfatizado que la va- 
loracidn por computadora es tan ficil de lograr 
y tiene una apariencia tan impresionantc que 
tanto los usuarios como los receptores del in- 
formc narrativo pueden confundirla con una 
evaluacidn compicta. Pero existe una diferen- 
cia entre prueba y evaluation. El clfnico expe- 
rimentado sabe que las pruebas psicoldgicas 
—ya sea tradicionales o por computadora— 
constituyen s6lo el primer paso en una eva¬ 
luation compicta. Cuando dsta se (leva a cabo, el 
clfnico compctentc va mis alia de los resulta- 
dos de la prueba para integrar las conclusiones 
dentro de la situacidn vital y antcccdcntcs psi- 
coldgicos completos de la persona examinada. 
En contraste, es poco comun que un informe 
narrativo por computadora haga referencia a in- 
formacidn externa a la prueba. como son el pro- 
pdsito dc la cvaluaci6n, el funcionamiento 
adaplativo recientc del clientc o las impresio- 
ncs dc la entrevista. que podrfan contradccir en 
gran medida las infcrcncias basadas en la prue¬ 
ba acerca de la personalidad. 

En su crftica sobre las pruebas por compu¬ 
tadora, Lanyon (1984) ha enfatizado que la 
interpretacidn impresa carccc de validez demos- 
trada. De hecho, la mayor parte de las interpre- 
taciones automatizadas dc una prueba se basan 
en cl saber clfnico mis quc en la validacion 
cmpfrica —es decir, tienen una naturalcza clf¬ 
nica mis quc actuarial. Aunque los comcrcia- 
lizadores pueden llcvar a cabo cstudios de 
satisfaccidn de sus clientes (p. cj., “tQud tan 
salisfecho sc encuentra usted con la afirmation 
narrativa X acerca del clientc )T’), estos anili- 
sis no sustituyen el cuidadoso cscrutinio dc la 
validez interpretativa. Lanyon (1984) tambitSn 
sehala con alarma que los sistemas de interpre- 
tacidn automitica dc prucba que cstin disponi- 
blcs aumentan de mancra exponencial. Casi 
cualquicr persona puede comprar algunos de 
ellos para instalarlos en su computadora perso- 
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nal dentro del hogar. Estos avances prcdiccn 
un sombrfo futuro: 

Exists peligro real de que los muchos servicios 
Insatisfactorios expulsen a aquellos pocos que 
son satistactorios, dado que los prolesionales 
consumidores son, en general, incapaces de 
discrimlnar entre ellos y estdn predispuestos a 
creer cualquier cosa que es(6 impresa. En par¬ 
ticular, es angustiante que la lalta de validez de- 
mostrada para los programas se haya vuelto en 
la actualidad la norma y parece no haber una ga- 
ranlia en contra del mayor avance de esta situa¬ 
tion insostemble. Quiza ha llegado el momento 
de que se creen reglamentos federates para esta 
Industrie, los cuales serian necesarios para la pro¬ 
tection del consumidor (Lanyon, 1984), 

Matarazzo (1986) hace sonar una alarma similar 
cuando advierte que la profesidn de la psicolo- 
gfa dcbe rcgularse o se arrtesga a la incursidn 
del Estado dentro de la prdctica de las pruebas 
psicoldgicas. 

Otro problema con las pruebas por compu- 
tadora tiene que ver con el hecho de que es 
poco comun que los informes narrativos auto- 
matizados vayan firmados. Los informes que 
no llevan una firma hacen surgir horrendas cucs- 
tioncs con respecto a la responsabilidad profe- 
sional y la culpabilidad legal. Supdngase que 
un cliente resulta danado a causa de un infor- 
mc tmpreciso hecho por computadora. ^Quidn 
tiene la culpa? iQui£n es legalmcntc responsa- 
blc? La culpa puede residir en el psicdlogo que 
utilizd el programa de computadora, en la em- 
presa lucraliva que vendid el programa o en el 
programador individual que incorpor6 la afir- 
macion (o afirmacioncs) ofensiva dentro del 
software. Pero, en general, la responsabilidad 
legal reside en el psic61ogo individual. La lec- 
ci6n es que utilizar un sistema automatizado no 
absuelve al profesional de la responsabilidad 
sobre las consecucncias de un informe por 
computadora (ejemplo de caso 15-1). 

A mediados del dccenio de 1980, la American 
Psychological Association adoptd las Guidelines 
for Computer-Based Tests and Interpretations 
(1986). Estas pautas se rcproducen en Butcher 
(1987, Apendice B). El propdsito general de 
las pautas es interpretar los Standards for 
Educational and Psychological Testing (AERA, 


APA, NCME, 1985) en su relacidn con las prue¬ 
bas aplicadas e interpretadas por computadora. 
Dos pautas importantes incluyen lo siguiente: 

1. Debe estableccrse el grado cn que las afir- 
maciones en un tnformc interpretative sc ba- 
san cn investigacidn cuantitativa versus la 
opinidn clfnica experta. 

2. Cuando las afirmaciones dentro de un infor¬ 
me interpretativo se basan en la opinidn clf¬ 
nica experta, los usuarios deben recibir 
informacidn que les permita pondcrar la cre- 
dibilidad de dicha opinion (Butcher, 1987). 

Las puutas tambicn detallan los muchos otros 
requisitos que deben satisfaccr los autorcs, edi- 
tores y usuarios de las pruebas. Quizes estos 
pasos hacia la autorregulacidn ayudardn a au- 
mentar la respetabilidad y aceptabilidad de la 
rcdaccidn de informes por computadora. De 
otra mancra, parecerfa inevitable un aumento 
cn la incursidn del Estado dentro de la prdctica 
de las pruebas psicoldgicas. 


PRUEBAS ADAPTATIVAS 
COMPUTARiZADAS 


Una ventaja final de las pruebas por computa- 
dora cs su aplicacion a un examen flexible y 
adaptable. Las pruebas adaptativas no son nada 
nuevo —Binct las utiliz6 cuando desarrolld los 
mdtodos para encontrar los reactivos basales y 
superiores cn su famosa prueba de inteligen- 
cia. Este autor eoloed sus reactivos cn un con- 
tinuo de dificultad. de modo que el examinador 
pudicra someter a prueba en sentido inverso 
para encontrar el nivcl basal de la persona eva- 
luada y de manera ascendcntc para encontrar cl 
nivel superior. Este procedimicnto elimind la 
ncccsidad de aplicar reactivos irrclevantes, 
aquellos tan f&ciles (por debajo del nivel basal) 
que la persona aprobarfa con toda seguridad o 
aqudllos tan diffcilcs (por encima del nivel su- 
jjerior), que la persona fallarfa con toda certc- 
za. Otro ejemplo de prueba adaptativa es el 
procedimicnto en dos ctapas, dondc se utilizan 
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EjEMPLO DE CASO 15-1 

CONFIANZA IRREFLEXIVA EN UN INFORME DEL MMPI POR COMPUTADORA 

En un caso civil, un mecbnico demandb a un psicblogo clinlco debido a que habfa conliado de 
manera inapropiada en una interprolacibn de prueba por compuladora. El mecbnico Irabajaba 
para una gran companfa que posefa una flotilla privada de helicbpleros. El trabajo del mecbnlco 
consistfa principalmente en el mantenimlento y verificacibn de la seguridad de los hellcbpteros. 
Como parte de una polltica corporatlva progresiva, el mecbnico consultb con un psicblogo 
conlratado por la comparila acerca de un problema relativamenle menor que implicaba un conflicto 
familiar. El psicblogo le aplicb el MMPI at mecbnico y envib el protocolo a un notable servicio de 
inlerpretacibn del MMPI. Pocos dias despubs, llegb por correo una interpretacibn por computadora. 
Este informe estaba lleno de un texto narrativo alarmante. Mencionaba la enorme probabilidad 
de problemas con drogas y alcohol, la notable posibilidad de arranques explosivos y la fuerte 
probabilidad de pensamiento paranoide explfcito. Se caracterizaba al cliente como una persona 
inestable, vengativa, paranoide y, posiblemente, peligrosa para sf misma y para los demas. 
Como es comprensible, el psicblogo se sintib alarmado. Afirmando tener el permiso del cliente, 
bste le comunicb a los directivos de la companfa los resultados del informe del MMPI. El supervisor 
del mecbnico demandb que se realizaran valoraciones adicionales para abuso de alcohol y tras- 
lorno psicolbgico. Cuando el mecanico se negb, se le dio un permiso por enfermedad y finalmente 
se le despidib. En ese momento presentb una demanda en contra del psicblogo y de la companfa. 
El caso se arreglb fuera del tribunal mediante una fuerte suma de dinero. 

Lo que hace que este caso sea pertlnente es que el informe por computadora discrepaba en 
gran medida con respecto al funcionamiento documentado del cliente. Aunque el mecbnico 
reconocia un problema anterior con la beblda, ya no utilizaba drogas o alcohol. En su historial de 
trabajo no se encontrb evidencia de arranques explosivos. Sus evaluaciones laborales anuales 
eran siempre satisfactory. Sus supervisors y companeros de trabajo lo describieron como 
carente de sentido del humor, pero no lo consideraban inestable, vengativo, paranoide o peligroso 
en ningun sentido. En apariencia, el psicblogo confib demasiado en la validez de la interpretacibn 
por computadora. El informe presentaba un tono excesivamente patolbgico. El error esencial del 
psicblogo consistib en aceptar de manera acritica el informe, en vez de verificar su validez contra 
otras fuentes de informacibn acerca del mecbnico. Esto nos recuerda la conclusibn cfnica pero 
precisa de Lanyon (1984) acerca de los informes por computadora (sehalada antes) en cuanto 
a que "los profesionales consumidores estan en general... predispuestos a creer cualquier cosa 
que estb impress”. Tambibn se debe mencionar que no se considerb responsable al servicio de 
interpretacibn del MMPI. En ultima instancia, era el profesional quien tenia la responsabilidad 
de las consecuencias de la interpretacibn de prueba por computadora. 


los resultados de una prueba direcliva para 
dcterminar el nivcl de entrada en escalas sub- 
secuentes. Por cjcmplo, en la Stanford-Binet: 
Cuarta Edicibn, los resultados de la subprue- 
ba inicial de vocabulario detcrminan el punto 
de inicio para las subpruebas subsccuentes. Al 
reducir el liempo nccesario para obtcner una 
medida prccisa de la capacidad. las pruebas 
adaptativas satisfacen un propbsito muy cons¬ 
tructive. 

Las pruebas adaptativas computarizadas 

(CAT; del ingibs computarized adaptative 


rtrsri'«g)constituyen una familiade procedimien- 
tos que permiten la medicibn precisa y cficaz 
de la capacidad (Weiss, 1985; Weiss y Vale. 
1987). Aunque los dctalles difieren de un mb- 
todo a otro, la mayor parte de las formas de las 
pruebas adaptativas computarizadas comparten 
las siguientes caracteristicas: 

1. Con base en un extenso mbtodo de preprueba, 
se valoran de manera precisa las caracteris¬ 
ticas de respuesta de cada reactivo (porccn- 
tajc de aprobacibn versus capacidad). 
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2. Estas caractcrfsticas de respuesia de los 
rcactivos sc programan cn la computadora 
junlo con una cstralcgia CAT dc sclcccidn 
de reactivos. 

3. En la sclcccidn del siguicntc rcactivo quc sc 
prcscnta, la computadora uliliza la historia 
total dc rcspucstas rcalizadas hasta esc mo- 
mento por la persona cxamtnada. 

4. Despuds dc cada respuesta, la computadora 
vuelve a calcular el nivel cstimado de capa- 
cidad dc la persona examinada. 

5. La computadora tambidn estima la precisidn 
de la medicidn (p. ej.. error estdndar de me- 
dicidn) despuds dc cada respuesta. 

6. La prueba continua hasta quc sc alcanza un 
nivel predeterminado dc precisidn en la me¬ 
dicidn. 

7. La calificacion de la persona examinada se 
basa en el nivel dc dificultad y en otras ca- 
racterfsticas de medicidn de los reactivos 
aprobados, no en el numcro total dc aqud- 
llos corrcctos. 

Las ventajas de medicidn de las CAT pueden 
resumirse cn dos palabras: prccisidn y eficicn- 
cia (Weiss y Vale, 1987). En cuanto a la precision, 
las CAT garantizan que se mida a cada persona 
con cl mismo grado dc precision debido a que 
la prueba continua hasta que cste critcrio sc sa- 
tisfacc. Esto no ocurrc con las pruebas tradi- 
cionalcs, dondc las calificaciones en ambos 
extremos de la distribucidn reflcjan mayorcs 
nivelcs de error de medicidn que aqudllas al 
centra de la misma. En cuanto a eftciencia, el en- 
foque dc las CAT rcquicrc de muchos menos 
reactivos de los que sc nccesitan cn las aplica- 
cioncs tradicionales. Por ejemplo, los exame- 
nes escritos para ccrtificacidn incluyen por lo 
comun de 200 a 500 reactivos, micnlras que 
los CAT son siempre mas cortos y con frecucncia 
incluyen menos de 100 reactivos para lograr un 
nivel mds precise de medicidn (Lunz y Beigstrom, 
1994). En un analisis, la confiabilidad dc las 
pruebas adaptativas computarizadas altemati- 
vas para la ccrtificacidn cn tecnologfa mcdica 
fuc de .96 (Lunz, Bergstrom y Wright, 1994). 
Esto cs notable, ya que las pruebas m«1s breves 
(que es la meta en las CAT) tienden a ser me¬ 
nos confiables que aquellas mas extensas (como 


las que se encucntran cn los programas tradi- 
cionalcs de prueba). 

El enfoque de las CAT para el examen psi- 
coldgico sc ha utilizado principalmentc en gran- 
des instituciones como el Ejdrcito de EUA y cl 
Educational Testing Service, para la evaluacidn 
de la intcligencia y capacidades cspecialcs. En 
anos recientes, las juntas nacionales de been- 
cias (p. ej., cn medicina) han comenzado a po- 
ncr cn prdctica los exdmenes CAT debido a la 
convenience en la programacidn de pruebas, 
mayor control sobre la seguridad de los exfi- 
menes, reduccidn en costos y oportunidad de 
obtencidn de mejores datos (Lunz y Bergstrom, 
1994). La informacidn tecnica sobre los siste- 
mas CAT estd patentada y es diffcil dc obtencr. 
Sin embargo, cs claro que la eftciencia del en¬ 
foque CAT es sustancial. fistas utilizan menos 
reactivos de mejor calidad que una prueba con- 
vencional dc la misma extensidn. Una conclusidn 
general es que las CAT rcduccn la extension de 
una prueba en cerca de 50%, con disminucio- 
ncs para los individuos exatninados de hasta 
80%, sin pdrdida dc la prccisidn cn la medida 
(Laatsch y Choca, 1994; Weiss y Vale, 1987). 

Del mismo modo en conformc que los cos¬ 
tos de las computadoras continuan disminu- 
yendo de manera notable, se desarrollardn 
aplicacioncs a mayor escala de las CAT. A fina¬ 
les del decenio dc 1990, cl Educational Testing 
Service avanzd hacia una confiabilidad casi to¬ 
tal cn las versiones CAT del Graduate Record 
Examination (Examen de Registro de Posgrado) 
y otras pruebas de selcccidn. Las juntas de li- 
cencias y certificacidn como el National Council 
of State Boards of Nursing tambidn han intro- 
ducido versiones CAT en sus pruebas de ccrti¬ 
ficacidn. Mills y Stocking (1996) analizan las 
cucstioncs practicas dc las pruebas computari¬ 
zadas aplicadas a gran escala. 


FUTURO DE LA APUCACI6N 
DE PRUEBAS 


En los inicios del siglo XXI, ;,cudl es cl futuro 
de la aplicacidn de pruebas psicologicas? A 
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continuacion se arriesgan algunas cspcculacio- 
ncs. a pesar dc saber que con frecuencia los 
prondsticos del futuro son incorrectos. La pre- 
diccidn de los avances en pruebas cs cspccial- 
mente diffcil debido a que la opinidn publica 
rcstringc cada vez m4s, ya sea de manera direc¬ 
ta o indirecta, esta empresa. Por ejemplo, en 
algun momento dumntc cl dcccnio dc 1980, la 
legislatura del cstado dc California determind 
que era ilegal que los psicologos escolares uti- 
lizaran pruebas tradicionales de inteligencia 
como base para asignar a los alumnos a clascs 
dc educacion especial. Estas restricciones so- 
bre las pruebas fucron cl producto de la indig- 
nacidn publica accrca dc la asignacidn excesi va 
de estudiantes dc minorfas a clases de educa- 
cidn especial. Asf, aunque sea factible una tec- 
nologfa particular de las pruebas y la promuevan 
los psicdlogos, cxislc la posibilidad de que se 
le controlc dc manera cstiicta o, incluso, que se le 
prohfba. 

Un caso especffico a propdsito del tema se 
cncucntra en la prediccidn dc Matarazzo (1992) 
accrca dc que las medidas biologicas de la in¬ 
teligencia obtendrdn un lugar mas dcstucado cn 
el siglo XXI. Con seguridad, parece cierto que 
las medidas bioldgicas de la capacidad, como 
cl potencial evocado promedio (cstimado a par- 
lir de las ondas cn el EEG) o la tasa metabd- 
lica dc la glucosa en el cerebro (estimada a 
partir de rastreos TEP) o el (amano relativo 
del cerebro (estimado a partir dc rastreos de 
IRM). rcsultardn enfoques cfcctivos para la eva- 
luacidn (vdasc cl tema 5A, Teonas y la medi- 
cidn de la inteligencia). Pero Matarazzo (1992) 
va un paso mils alia al afirmar que, dc hccho. 
dstos y olros enfoques bioldgicos sc volverdn 
de uso comun: 

Por tanlo, otra de mis predicciones es que en los 
primeros decenios del siglo xxi es posible que 
veamos un mayor desarrollo y utllizaclon den- 
tro de la practica de dstos y otros Indices dei 
tuncionamiento y eslructura cerebral en una prue- 
ba (o bateria de pruebas) para la medlcibn de las 
dllerenclas Indlvlduales en capacidad mental, con 
lo cual se anurveiard la primera soparacion clara 
en un siglo con rospecto a los reactivos de una 
prueba y examenes de la tradicibn de Binet (p 
1012. negritas tomadas del original). 


Aunque el prondstico dc Matarazzo puede vol- 
versc rcalidad, un csccnario mds probable es 
que cl publico cn general se sienta amenazado 
cuando se utilicen los Indices bioldgicos en la 
cvaluacidn y, por tanto, lomard medidas (p. cj., 
presionara los legisladores) para garantizarque 
dichas medidas reciban aplicacidn limilada (o 
nula). El piiblico se senlird amenazado debido 
a que, de manera corrccta o incorrecta, las ca- 
ractcrfsticas biologicas como la tasa metabdlica 
de la glucosa cn el cerebro se percibcn como re- 
lativamentc permanentes e inmutables. Surgird 
cl temor de que las pruebas bioldgicas clasifi- 
quen a las personas en sistemas dc castas. Inclu¬ 
so si se cstablccc (o cuando se establezca) de 
manera firmc la validcz de las pruebas bioldgi¬ 
cas, pasardn decenios (si es que acaso algun 
dfa ocurre) antes dc que el publico general las 
encuenlre aceptables. 

Por otro lado, la conversidn de pruebas a 
versiones por computadora es una parte inte¬ 
gral dc las sociedades industrializadas y esta 
tendencia aumentard en cl futuro. Las pruebas 
existentes sc adaptardn a las computadoras per¬ 
sonates con una regularidad cada vez mayor. 
Un ejemplo de esta tendencia cs la Fepsy 
(Ferrum + Psyche), un sistema dc pruebas 
ncuropsicoldgicas automatizadas que sc cn- 
cuentra disponible en Ifnca en 220 sitios a tra- 
v£s de Holanda y la mayor parte de Europa. La 
dcscripcidn del Fepsy se encuentra en la intemel 
en la direccidn www.euronet.nl Fepsy consistc 
de las siguientes subpruebas: 

• Tiempo de reaccidn auditiva. 

• Tiempo dc reaccidn para eleccidn binaria. 

• Tarea dc golpeteo. 

• Tarea dc busqueda visual. 

• Tareas de reconocimiento. 

• Tarea dc vigilancia. 

• Tarea rftmica. 

• Tarea dc clasificacidn. 

• Tareas de medios campos visualcs. 

• Golpeteo con cubos de Corsi. 

Un empleo comun es en la evaluacidn pre y 
posoperatoria de pacicntes que atraviesan por 
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cirugfa para la epilepsia, con el proposito de 
aliviar las convulsiones. El sistema se ha utili- 
zado con pacientes complctamente conscien- 
tes durante la cirugfa. Bajo ancstesia local, el 
pacicntc Irabaja en una subprueba nuentrasque. 
de mancra simuItAnca, recibe estimulacidn eldc- 
tiica inofcnsiva en sitios distintivos dc la corte- 
za. El proposito consistc en determinar si la 
ablacidn de tejido cicatricial del cerebro podrfa 
afectar funciones cognitivas espccfficas. La ven- 
(aja dc ulilizar un sistema multicentral, niultina- 
cional, dc pruebas por coniputadora es que el 
examinador ticne acccso a datos normativos de 
miles de pacientes con padecimientos cspecfficos. 

Otra prediccidn es quc las editoriales dc 
pruebas publicariin cada vez mcnos pruebas 
de amplio espcctro (p. ej., inventarios de per- 
sonalidad y pruebas individuates de inteli- 
gencia) (Gregory, 1998), En vez de cllo, sc 
conccntrarAn en pruebas disehadas para eva- 
luar Areas particulars de funcionainiento para 
poblacioncs espccfficas (p. cj., medidas del fun- 
cionamiento de la memoria para ancianos de 
los que existe sospecha de demencia). Las ra- 
zones para cstas tcndcncias complementary 
son de naturaleza econdmica: 


La publicaclbn de pruebas es un gran negocio, 
una manera respetable de que las grandes cor- 
poraciones obtengan una ganancia. Las edilo- 
riales se mostrardn renuentes a hacer la enorme 
inversion que se neceslta para desarrollar nue- 
vos Instrumentos que tienen la grandiose am- 
bicion de evaluar muchos aspectos de La per- 
sonalldad o intelecto en una amplia gama de 
personas. B costo es demasiado elevado y —ante 
la competencia existenle— el riesgo es dema¬ 
siado grande (Gregory, 1998, pp. 76-77], 

Es probable que los editors de pruebas se enfo- 
quen en formas menos costosas y arriesgadas 
dc dcsarrollo de pruebas, como en instrumen¬ 
tos que rpresentan constructs distintivos re- 
levantes para grupos especfficos. Los ejemplos 
podrfan incluir pruebas para medir conductas 
de riesgo en adolescentcs, disminucidn mental 
en ancianos, cogniciones defccluosas en per¬ 
sonas con depresidn, o problemas de comuni- 
cacidn en parejas con dificultadcs man tales. 
Estos tipos de instrumentos florcecrAn, mien- 
tras que los editors raras veccs invertirAn en 
nuevas pruebas generales de personalidad o 
capacidad, prefiriendo en su lugar la revision y 
rciclaje de los instrumentos existentes. 


RESUMEN 


1. El termino evaluncion psicoldgica asisti- 
da par coniputadora (CAPA) se refier al 
rango completo de aplicaciones compu- 
tacionales en la evaluacidn psicoldgica. 
Estas incluycn la aplicacidn, calificacidn c 
interpretacidn de pruebas; pruebas adap- 
tativas computarizadas y aplicaciones refi- 
nadas en multimedia. 

2. El primer uso dc las computadoras para 
proporcionar intcrpretaciones se puede en- 
contrar en la Clfnica Mayo a principios del 
decenio de 1960. El sistema interpretati¬ 
ve del MMP1 proporcionaba afirmaciones 
brves, cseala por escala, basadas en cl co- 
nocimiento clfnico. 

3. En la actuahdad se encuentran disponibles 
intcrpretaciones de prueba basadas en sis- 


temas (CBTI) para casi cualquier prueba 
psicoldgica publicada. Sc rcconocen cua- 
tro enfoques para dsta: informes dc califi- 
cacidn, informes descriptivos, informes 
actuarialese informes clfnicos asistidos por 
computadora. 

4. Los informes dc calificacion consisten s6lo 
de las califtcaciones, pcrfilcs o ambos. pero 
pueden incluir la representacidn grAfica 
de pruebas de significacidn cstadfstica e in- 
tcrvalos de confianza para las calificacio- 
nes dc una prueba. Estos informes destacan 
a pnmera vista las calificaciones significa- 
tivas y las diferencias en puntuacidn. 

5. Un informe descriptivo proporciona una 
interpretacidn breve, escala por escala, de 
los rcsultados de la prueba. Estos son espe- 
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cialmente utiles cuando las conclusiones dc 
una prueba sc trasmiten a profcsionales 
de la salud mental que tienen poco conoci- 
miento de la prueba en cuestion. 

6. En la interprctaciOn actuarial de una prue¬ 
ba se utiliza una formula denvada a nivel 
cmpfrico para diagnosticar, clasificar o pre- 
deeir la conducla. Este tipo de interpreta¬ 
tion contrasta con el enfoque clfnico, en el 
que cl psicOlogo procesa la information 
dentro de su cabeza para diagnosticar, cla¬ 
sificar o predeeir la conducta. 

7. Las comparacioncs empfricas entre la in¬ 
terpretation clfnica y la inteprelaciOn 
actuarial de pruebas han encontrado que 
esta ultima es superior en casi todos los ca- 
sos. Las intcrprctacioncs dc una prueba por 
computadora deberfan incorporar los mO- 
todos actuariales siempre que sea posible. 

8. En un informc clfnico asistido por compu¬ 
tadora, las afirmaciones interpretativas se 
basan en el juicio automatizado y compu- 
tarizado dc uno o mils expertos clfnicos. 
Este enfoque permite la interpretation dc 
todos los perfiles dc una prueba, no sOlo 
de aquellos que encajan con ciertos patro- 
nes actuariales. 

9. Las ventajas dc la interpretacion de una 
prueba basada cn sistemas incluyc la obje- 
tividad, velocidad y bajo costo. Una dc las 
principals desventajas es el peligro de que 
al psicOlogo se le excluya por completo del 


TERMINOS Y CONCEPTOS CLAVE 


proceso de evaluaciOn, lo cual aumenta el 
riesgo del uso indebido de los resultados 
dc una prueba. 

10. Los sistemas multimedia incluyen la pre¬ 
sentation realista, interactiva, de los estfmu- 
los dc una prueba por computadora (p. ej.. 
representat ion en video dc una situaciOn dc 
trabajo). Multimedia permite que se some- 
ta a prueba a los individuos cn cuanto a pro- 
blcmas complejos, de la vida real, como la 
soluciOn de conflictos en cl trabajo. 

11. Las pruebas adaptativas computarizadas 
(CAT) son una familia de procedimientos 
que permite la mediciOn prccisa y cficaz dc 
la capacidad. En cstc enfoque, la compu¬ 
tadora gufa la scIccciOn de reactivos con 
base en las respuestas anteriores de la per¬ 
sona examinada. 

12. El propOsito dc las CAT consiste en llegar a 
un nivel predeterminado dc precision de la 
mediciOn con el menor numero posible de 
reactivos de una prueba. Una conclusion 
tfpica cs que las CAT reduccn la exten¬ 
sion dc una prueba en cerca de 50%. sin 
pOrdida dc precision cn la medida. 

13. Esdiffcil pronosticarel futurode las pmebas. 
Mientras que algunas autoridades prcdicen 
un ineremento en la utilizaciOn dc medidas 
biolOgicas dc la intcligcncia, esto es incicr- 
to. Con seguridad, la automatizaciOn cada 
vez mayor de las pruebas es una tcndencia 
clara que sOlo puede intcnsificarse. 
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El principal punlo de visla quc sc cnfatiza 
cn csta obra es que las pruebas psicoldgicas han 
tenido una influcncia benefica en la sociedad 
modcma. Cuando sc les cmplca dc manera dti- 
ca y responsable. las pruebas proporcionan una 
base para llegar a inferencias sensatas acerca 
dc individuos y grupos. Despuds de lodo, la in¬ 
tention dc la larca consiste en promover la 
oricntacidn apropiada. tratamiento cficaz, va- 
loracidn precisa y toma de decisioncs cquitati- 
vas —ya sea en las pruebas individuals o en 
las cvaluaciones grupales inslitucionales. 
tQuidn podrfa tener queja sobre estos fines? 


Por fortuna, los psicdlogos, educadores, ad- 
ministradores y otras personas cn general apli- 
can las pruebas de modo responsable. Pero 
cxisten cxccpciones. Casi todos hemos escu- 
chado horribles andedotas, el alumno dc pri- 
maria provenienle de una minorfa y quc por 
casualidad ha recibido una etiqueta de retraso 
mental con base en una sola calificacidn de Cl; 
el estudiantc universitario con un diagnoslico 
poco plausible de esquizofrenia a partir dc una 
prueba proyectiva; el solicitanle de un empleo 
al que se ha descartado errdneamente de un tra- 
bajo con base cn una medida irrelevante; el as- 
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pirante a maestro quc ha recibido una vcntaja 
injusta cuando de antcmano una prucba dc coni- 
pctencia profesional se ha perdido dc mancra 
misteriosa; o el nifio de una minorfa a quien se 
ha penalizado cn una prucba dcbido a que el in- 
glds no es su lengua materna. Exccpcioncs 
como estas ilustran la necesidad de normas dti- 
cas y profesionales en la aplicacidn de pruebas. 

Uno de los principals propdsitos dc cstc 
tcma es introducir al lector a las normas dticas 
y profesionales que dan forma a la pnktica de 
las pruebas psicoldgicas. Tambidn se analiza el 
tema relacionado de las considcraciones espe- 
ciales cn la cvaluacidn de minorias culturales y 
lingUi'sticas. Ambos temas compartcn una su- 
perposicidn sustancial: cuando una persona 
evaluada no proviene de la cultura anglocstado- 
unidense mayoritaria (quc predominanlemente 
cs caucdsica, angloparlante, individualista, 
orientada al futuro), se elevan a un primer sitio 
las preocupaciones eticas y profesionales en la 
aplicacidn de pruebas. 

fundamentaci6n para las 

NORMAS PROFESIONALES 
DEPRUEBA 


F.n general, las pruebas se aplican de manera 
responsablc, pero como se seiiald con anterio- 
ridad, existen excepciones. En pocas ocasiones, 
el proceso de prueba es irresponsable a causa 
del discho mds quc por accidente. Considdrc- 
sc, con asombro cstremecedor, cl anuncio de la 
Sonda Mental presentado cn una revista de psi- 
cologfa popular: 

iUltimamente ha leido alguna mente Interesan- 
te? Con la Sonda Mental puede hacerto. Con solo 
unos mlnutos tendra el pertil de personalldad de 
cualquiera con precision cientifica. Este nuevo 
software de sislemas experlos le permlte descu- 
brir las cosas que la mayorla de la gente teme 
decide. Las fortalezas, debilldades, Intereses 
sexuales y mas (Eyde y Primhott, 1992). 

En este caso. la irresponsabilidad es tan flagran¬ 
te quc discutir sobre pautas dticas y profesio¬ 
nales es casi superfluo. 


No obstante, no siempre se presenta en 
agudos malices contrastantes, responsables o 
irrcsponsables. El verdadero rcto dc la cvalua¬ 
cidn competente consistc en determinar las fron- 
teras dc la prdctica dtica y profesional. Como 
suclc suceder, son los casos que estfin cn cl |f- 
mitc los que dan lugar a consideraciones. Se 
alienta al lector para que lea los dilemas aso- 
ciados con las pruebas que sc describcn en el 
Ejemplo de caso 15-2 y se forme una opinion 
acerca de cada uno. Estos ejemplos se basan cn 
informes de primera mano del autor. Al final 
de este capitulo sc regresard a estas anbedotas 
problemdticas. 

Los dilemas de la examinacidn psicologica 
no siempre tienen rcspucstas simples y obvias. 
Incluso los psicdlogos cuidadosos y experimen- 
lados pueden estar en desacucrdo acerca de lo 
quc es dlico y profesional en un caso especffico. 
Sin embargo, el alcancc de la prdctica profe¬ 
sional y btica no es cuestidn de gustos indivi¬ 
duates ojuicio personal. El empleo rcsponsable 
de pruebas estd definido por pautas escritas y 
publicadas por asociaciones profesionales 
como la American Psychological Association, 
la American Counseling Association, la 
National Association of School Psychologists 
y otros grupos. Lo sepan o no, todos los profe- 
sionalcs practicantcs deben lealtad a estas pau¬ 
tas, las cualcs se revisan mds adeiantc. 

En general, la evolucidn de las normas dti- 
cas y profesionales ha sido rcstrictiva casi de 
manera uniformc. al proporcionar una delimi- 
tacidn cada vcz mds estrecha de ddnde, cudndo 
y edmo pueden utilizarse las pruebas psicold- 
gicas. Desdc una pcrspectiva legal, Bcrsoff 
(1984) resumid las tendencias histdricas como 
sigue: 

En algun rnornento, el trabajo de los psicometras 
academ>cos y apllcados pasaba cast sin una re¬ 
vision por parte de la ley. pero a medlda que el 
uso de pruebas aumentd en EUA. tambien se 
Incrementb su potencial para causar un daho a 
las personas examinadas que era competen- 
cia de la ley. Como resultado, es probable que 
en la actualidad no exlsta una actividad realiza- 
da por los psicdlogos que ost6 bajo un escrutinio 
tan ceflido y bajo tal reglamentacibn del sislema 
legal como lo son las pruebas. 
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EjEMPIO DE CASO15-2 

DILEAAAS ET1COS Y PROFESIONALES EN LAS PRUEBAS 


1. Un psicdlogo consultor estd de acuerdo en llevar a cabo un examen de psicopalologla como 
seleccidn previa al empleo de candidates a oficiales de policia. Al principio de cada consulla, 
el psicdlogo le pide al candidate que lea y lirme una forma de consentimiento que describe de 
manera abierta y sincera el proceso de evaluacidn. No obstante, dicha lorma explica que no 
se le proporcionard a los candidates al empleo la informacidn especffica acerca de los resultados 
de la prueba. Pregunta: ie s etico que el psicdlogo niegue a los candidates tal informacidn de 
resultados? 

2. Un orientadorcompetente que ha recibido amplio enlrenamiento en la interpretacidn del MMPI 
continue utilizando este instrumento aunque lo ha sustituido el MMPI-2. Su lundamentacldn es 
simplemente que existe gran cantidad de investigacidn sobre el MMPI y 61 tiene confianza 
en el signiflcado de las elevaclones en los perfiles de esta prueba, mientras que sabe muy 
poco acerca del MMPI-2. Pregunta: £la negative del orientador a utilizar el MMPI-2 quebranta 
las normas profesionales? 

3. Se pide a un psicdlogo consultor que valore a un nirio de nueve arios de edad, de origen 
puertorriquerio, para examinar una posible discapaddad para el aprendizaje. El Idioma principal 
del nirio es el espariol, y su segunda lengua es el inglds. El psicdlogo intenta utilizar la Escala 
Wechsler de Intellgencia para Niftos—III (WISC-III) y otras pruebas. Debido a que no sabe 
espariol, el psicdlogo le pide a quien culda del nirio cuando este regresa de la escuela, que 
actue como traductora cuando se necesiten comunicar instrucciones de la prueba, preguntas 
especificas o las respuestas del nirio. Pregunta: £es una prdctica apropiada utilizar a un traductor 
cuando se aplica una prueba individual como el WISC-III? 

4. Cuando respondla la mitad de una baleria de pruebas para discapaddad para el aprendizaje, 
una angustiada estudiante universilaria de 20 arios de edad le confiesa un terrible secrete al 
psicdlogo. La cliente acaba de descubrir que es muy probable que su hermano de 25 arios, 
quidn murid Ires meses antes, haya sido pedbfilo. La estudiante le muestra al psicdlogo 
fotogralias de nirios desnudos posando en la habitacidn de su hermano. Para compllcar las 
cosas, el hermano vivla con su madre —quien aun desconoce su bien ocultada desviacidn 
sexual. Pregunta £el psicdlogo estd obligado a informar de este caso a las autoridades 
judiciales? 


En parte como respuesta al clima actual de quc- 
rellas legales, las organizaciones que se ocupan 
de las pruebas psicoldgicas han publicado pau- 
tas que de manera coicctiva definen las normas 
6ticas y profesionales relativas a la pnklica de 
la cvaluacidn. 

Estas normas tambidn se relacionan con las 
corporaciones c individuos que publican prue- 
bas. Se comienza con una exploracidn de las 
pautas para los editores de pruebas antes de 
analizar las responsabilidades de los usuarios 
dc las mismas El capftulo se cierra con una re- 


visidn de las preocupaciones especiales en la 
cvaluacidn dc minon'as culturales y lingUfsticas. 

RESPONSABILIDADES 
DE LOS EDITORES DE PRUEBAS 

Las responsabilidades de los editores tienen que 
ver con la publicacirin, mercadeo y distribucidn 
dc sus pruebas. En particular, se espera que 
publiquen pruebas dc alta calidad, mcrcadecn 
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su producto de manera responsable y restrin- 
jan su distribucibn sblo a personas con los rc- 
quisitos adecuados. Se consideration cada uno 
de estos tcmas. 

CUESTIONES DE PUBLICACldN 
Y MERCADEO 

Gn cuanto a la publicacibn de instrumentos 
nucvos o rcvisados, la pauta mas importante 
consiste en protegersc contra la difusibn pre¬ 
matura dc una prucba. Estas son una cmprcsa 
noble, pero tambien son un gran ncgocio im- 
pulsado por las ganancias, lo cual rcsulta cn una 
prcsibn inhcrcnte hacia la pronta difusidn dc 
materiales nuevos y revisados. Quizas esta es 
una de las razones por las quc la American 
Psychological Association y otras organizacio- 
nes han publicado normas que se rclacionan con 
la publicacibn dc pruebas (AERA/APA/NCME, 
1985, 1999). Dichas normas se relacionan en 
particular con los manuales tecmcos y gufas pa¬ 
ra usuarios quc por lo comun acompanan a una 
prueba. Estas fuentes deben scr suficientemen- 
te complctas, dc modo que un usuario o revisor 
calificados puedan valorar la pcrtincncia c ido- 
ncidad tecnica dc la prueba. Esto signified quc 
los manuales y gufas informariin en detalle los 
datos cstadfsticos sobre anrtlisis dc confiabi- 
lidad, cstudios de validcz, muestras normati vas 
y olros aspectos tdcnicos. 

El mercadeo de pruebas de manera respon¬ 
sable se refiere no sdlo a la publicidad (que debe 
ser precisa y formal), sino tambien al modo en 
que sc presenta la informacibn en los manuales 
y gufas. En particular, los autorcs de pruebas 
deben esforzarse en lograr una prcscnlacibn 
equilibrada de sus instrumentos y abstenerse dc 
una manifcstacibn unilateral de la informacibn. 
Por ejemplo, si algunos estudios prcliminares 
reflejan una imagen deficiente dc una prueba, 
se les debe dar una ponderacidn justa cn cl 
manual junto con las conclusioncs positivas. Dc 
la misma manera, si se puede anticipar cl cm- 
pleo incorrecto o inapropiado de una prueba, 
cs nccesario que el autor anal ice tambien esta 
cuestidn. 


COMPETENCIA DE LOS COMPRADORES 
DE PRUEBAS 

Los editores de pruebas reconocen la cnornte 
responsabilidad dc quc sdlo los usuarios califi¬ 
cados deben tener la posibilidad de comprar sus 
productos. A manera dc una breve nevisidn (vea- 
se el tema 2A, Naturaleza y usos dc las prue¬ 
bas psicoldgicas), las razones para el acceso 
rcstringido incluycn cl potencial de dano si las 
pruebas caen en manos inndecuadas (p. cj., un 
estudiante de pregrado en psicologfa aplica cl 
MMPI-2 a sus amigos y despuds hace pronun- 
ciamicntos aterradores acerca de los rcsulta- 
dos) y el hccho obvio de que muchas de cllas 
ya no pueden considcrarsc vdlidas si el exami- 
nando potencial las ha revisado de antema- 
no (p. cj., un maestro memoriza las respucstas 
comectas para un examcn de certificacibn). 

Estos ejcmplos ilustran quc cl acceso a las 
pruebas psicoldgicas debe ser limitado. Pero, 
Jimilado para quidnes? Rcsulta ser que la res- 
puesta depende de la complcjidad de la prueba 
cspecffica bajo considcracidn. Las pautas pro- 
puestas hace muchos anos por la American 
Psychological Association (APA) continiian 
siendo pertinentes hoy en dfa, a pesar de quc 
no todos los editores las ponen en prdctica. La 
APA propone quc las pruebas se clasifiquen cn 
tres niveles dc complcjidad (A, B y C) que re- 
quieren diferenles grados dc conocimicnto ex- 
perto por parte del examinador. 

Nivel A: estos instrumentos son medidas 
sencillas de lapiz y papcl quc pueden apli- 
carsc, calificarse e interpretarse con un 
tnfnimo de entrenamiento. Con ayuda de 
un manual, personas rcsponsablcs sin 
entrenamiento cn psicologfa, como cjecuti- 
vos comerciales o administradores educa- 
tivos, pueden utilizar estas pruebas. Esta 
categorfa incluyc pruebas grupalcs de 
destreza vocacional y de aprovccha- 
miento cducativo. 

Nivel B: estas requieren conocimicnto sobre 
construccidn de pruebas y entrenamiento 
en estadfstica y psicologfa. Estos produc¬ 
tos estan disponibles para personas que 
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han terminado cursos avanzados cn 
pruebas en una escuela o universidad 
acrcditada, o entrenamiento cquivalcntc 
bajo la supervisidn dc un psicdlogo 
calificado. Esta catcgorfa incluye pruebas 
de aplitud c inventarios dc pcrsonalidad 
aplicablcs a poblaciones normales. 

Nivel C: estas pruebas requieren de com- 
prensidn suslancial sobre las pruebas y 
temas asociados. La experiencia bajo 
supervisidn es escncial para la aplicacidn, 
calificacion e intcrprctacidn apropiadas de 
estos instrumentos. Por lo comiin, las 
pruebas del Nivel C cstdn disponiblcs sdlo 
para personas con un mfnimo de macstrfa 
en psicologfa o en un campo relacionado. 
Estos instrumentos incluyen pruebas 
individuates de intcligcncia, pruebas pro- 
yectivas dc la personalidad y baterfas de 
pruebas neuropsicoldgicas (American 
Psychological Association, 1953). 

En general, los editorcs dc prueba tratan de 
dcscartar las solicitudes inapropiadas al solicitar 
a los compradores las credencialcs necesarias. 
Porejemplo, la Psychological Corporation, uno 
dc los principales provccdores de materiales dc 
prueba en EUA, requiere que los futuros con- 
sumidorcs llenen una forma de regislro en la 
que detnllcn su entrenamiento y experiencia con 
pruebas. Los compradores que no poscan un tf- 
tulo avanzadoen psicologfa deben listaren deta- 
lle los cursos sobre aplicacidn e intcrpretacidn 
dc pruebas y sobre estadfstica. Tambien se so- 
licitan referencias. 

La mayorfa dc los editorcs dc pruebas tam- 
bidn espccifican que los individuos o grupos 
que proporcionan pruebas y orientacidn por 
correo no pueden adquirir los materiales. En 
una nota relacionada, las normas dlicas des- 
alicntan en la actualidad la aplicacidn de prue¬ 
bas “para llcvar a casa" con sus clientes. Hasta 
hace pocos afios, dsta era una pnktica ocasio- 
nal con las pruebas extensas dc personalidad 
como el MMPI. El comitd de dtica rcfrendd los 
siguientes puntos: 

1. En general, la aplicacidn sin vigilancia del 
MMPI no representa una prdctica rcsponsa- 


ble dc prueba y puede resultar cn una eva- 
luacidn invdlida pordiversas razones (p. ej., 
influcncia de otras personas o responder la 
prueba en un cstado dc intoxicacidn). 

2. La seguridad de la prueba se pone en entre- 
dicho cuando se permite que cl MMPI saiga 
del ambiente clfnico. 

3. Existc debate en cuanto a si hay alguna cir- 
cunstancia en la que podrfa considerarsc ra- 
zonable y apropiado permitir que el MMPI 
sc responda fuera del ambiente clfnico. 

4. Estas cuestiones no son unicas del MMPI, 
sino que deben considerarsc cuando se rea- 
liza cualquier evaluacidn. 

5. Cuando se juzgan las cuestiones eticas aso- 
ciadas con la aplicacidn de pruebas cn el 
liogar, es importante considerar cosas tales 
como la naturalcza y propdsito dc la prueba 
y la informacidn disponible sobre gonfiabi- 
lidad, validez y proccdiinientos de estanda- 
rizacidn (APA, 1994b, pp. 665-666). 

En general, sc aconseja que los usuarios no 
apliquen pruebas “para llevar a casa" y se ex- 
horta a los editores a negar acceso a los profe- 
sionalcs o grupos que promuevan esta prdctica. 

Aunquc los editorcs intentan filtrar a los 
compradores no calificados, de todas mancras 
pueden exislir casos cn los que se venden prue¬ 
bas confidcnciales a individuos poco escrupu- 
losos. Oles y Davis (1977) descubrieron que los 
cstudiantes de posgrado en psicologfa podfan 
comprar el WISC-R, MMPI, TAT, Stanford- 
Binet y 16FP si escribfan las drdenes de com- 
pra cn la papelerfa de la universidad, colocaban 
las letras Ph.D. despuds de sus nombres, in- 
clufan el pago y utilizaban una direccidn en una 
oficina postal. Aunquc las drdenes ilfeitas de 
prueba son pocas en cuanto a numero, sf llegan 
a ocurrir. 


RESPONSABIUDADES DE LOS 
! USUARIOS DE PRUEBAS 


La evaluacidn psicoldgica de la pcrsonalidad, 
intcreses, funcionamicnto cerebral, aptitudes o 
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inteligencia constituye un acto profesional deli- 
cado que deberfa rcalizarse con supremo cui- 
dado del bienestar de la persona examinada, su 
Camilla, cmpleadores y la red mis amplia dc 
institucioncs socialcs quc podrfan resultar afec- 
ladas por las conclusiones de una evaluacidn 
clfnica particular (Matarazzo, 1986, 1990). A 
travds dc los afios, la profesidn de la psicologia 
ha propuesto, aclarado y estrechado una serie 
de normas acabadas y cuidadosas para propor- 
cionar una gufa al practicante individual. Las 
organizacioncs profesionales publican princi- 
pios dticos formales quc concicrnen al uso de 
pruebas, incluycndo la American Psychological 
Association (APA, 1992), la American 
Association for Counseling and Development 
(AACD, 1988), la American Speech Language- 
Hearing Association (ASHA, 1991) y la 
National Association of School Psychologists 
(NASP, 1992). 

Ademis de los principios dticos, van as or- 
ganizaciones relacionadas con el uso de prue¬ 
bas han publicado normas pricticas quc ayudan 
a definir cl espectro del empleo responsable de 
pruebas. Las fuentes de las pautas para su uso 
incluyen grupos dc enserianza (AIT. NCME, 
NEA, 1990), la American Psychological 
Association (APA, 1992b), el Education Test 
Service (ETS, 1987,1988,1989), cl Joint Committee 
on Testing Practices (JCTP, 1988), la Society 
for Industrial and Organizational Psychology 
(SIOP, 1987) y las asociacioncs profesionales 
(AERA, APA y NCME, 1985, 1999). Por ulti¬ 
mo, deberfa mcncionarse que los principios del 
uso responsable de las pruebas se han sinteti- 
zado en un ilustrativo registro de casos publi¬ 
cado de manera conjunta por varios grupos 
relacionados con la aplicacidn de pruebas 
(Eyde, Robertson. Krug y otros, 1993). 

Las docenas de pautas relativas al uso de 
pruebas son bastante especfficas, por cjemplo: 

Norma 6.8: cuando los resultados de una prueba 
se proporctonan a medios noticiosos, aqubllos 
responsables de la entrega de los resultados 
deben brindar inlormacidn que ayude a reducir 
al mfnlmo la poslbllldad de interprelaciones erro- 
neas de diehos resultados (AERA, APA Y NCME, 
1985). 


Debido a su cspecificidad, un anilisis detallado 
de las normas dticas y profesionales pertinen- 
tes esti mis alii del campo de accidn dc este 
libro. Lo que sigue cs un resumen de las dispo- 
siciones generales que se relacionan con la prac- 
tica responsable de la aplicacidn de pruebas 
psicoldgicas y de la evaluacidn en psicologia 
clfnica. 

Estos principios se aplican a los psicdlo- 
gos, estudiantes de psicologia y otras personas 
que trabajan bajo la supervisidn de un psicdlo- 
go. Esta discusidn sc restringe aquellos princi¬ 
pios que tienen relation directa con la prictica 
de las pruebas psicoldgicas. La observancia ade- 
cuada dc estos preccptos puede climinar la 
mayor parte —si no es que todos— los desa- 
ffos legates del uso de pruebas. 

PROTECCI6N de los mejores 

INTERESES DEL CLIENTE 

Varios principios dticos rcconocen que todos 
los servicios psicologicos, incluyendo la eva¬ 
luation. se proporcionan dentro del contexto 
de la relacidn profesional. Por tanto, los psied- 
logos estin obligados a aceptar la rcsponsabili- 
dad implfcita en esta relacidn. En general, el 
profesional se gufa por una pregunta prepon- 
derantc: <-,cuiIcs son los mejores intcreses del 
cliente? La implicacidn funcional de esta pauta 
es que la evaluacidn debe satisfacer un propd- 
sito construed vo para la persona examinada. De 
no ser asf, es probable que cl profesional estd 
violando uno o mis principios dticos espeeffi- 
cos. Por cjemplo, la Norma 6.5 del manual de 
Normas (AERA, APA Y NCME. 1985) advier- 
te a los usuarios dc pruebas que deben evitar 
acciones que puedan tener consecuencias ne- 
gativas no intencionales. Pcrmitirque un clien¬ 
te dd significados adicionales no sustentados a 
los resultados de una prueba irfa en contra de los 
intcreses del cliente y, por tanto, constituirfa una 
prictica poco dtica de aplicacidn de pruebas. 
De hecho, con ciertos clientes propensos a la 
prcocupacidn y a tener dudas acerca de ellos 
mismos. un psicdlogo podrfa elegir no utilizar 
una prueba apropiada, dado que es casi seguro 
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que estos clientes interpreter! de manera crr6- 
nca y autodestructiva casi cualquicr resultado 
de prueba. 

CONFIDENCIALIOAD Y OBUGAC|6n 
DE ADVERTIR 

Los profesionalcs ticnen la obligacidn primor¬ 
dial de protegcr la confidencialidad de la infor- 
macidn, incluyendo los resultados de una 
prueba, que puedan obtener de sus clientes en 
cl curso de una consulta (Principio 5, APA, 
1992a). Dicha informacidn puede comunicar- 
se de manera dtica a otras personas s6lo des- 
puds de que el clicnte o su representante legal 
dan su consentimiento sin ambigUedadcs, en ge¬ 
neral porcscrilo. Las unicas exccpcioncs a la con- 
fidcncialidad implican aquellas circunstancias 
poco comunes en las que rctener informa- 
ci6n podrfa representar un peligro evidente para 
el cliente o para otras personas. Por ejemplo. la 
mayor parte de los cstados en EUA han apro- 
bado lcyes que obligan a los profesionales de 
la salud a informar de todos los casos en los 
que se sospcche la cxistencia de maltrato a ni- 
fios y de ancianos bajo circunstancias vulncra- 
bles. En la mayor parte de los cstados, un 
psicdlogo que se entera en cl curso de la apli- 
cacion de pruebas que el cliente ha abusado 
ft'sica o sexualmentc de un nino, liene la obli- 
gacidn de dar esta information a la victima po¬ 
tential, a los agentes de la ley, o a ambos. 

Los psicdlogos tambien ticncn Una obliga- 
cion de advertir que surge de la decision de 
1976 para el casoTarasoff (Wrightsman, Nietzel 
y Fortune, 1994). Tanya Tarasoff, una joven es- 
tudiante universitaria en California asesinada 
por Prosenjit Poddar, un estudiantc de la India. 
Lo que hace que este caso sea pertinente para 
la prdctica de la psicologfa cs que Poddar le 
habfa manifestado al terapeuta de la universi- 
dad sus intencioncs de ascsinar a Tarasoff. Aun- 
que el terapeuta le advirtid a la poliefa que 
Poddar habfa expresado cstas amenazas, no le 
avisd a Tarasoff. Dos meses despuds, Poddar 
apuhald y maid a la joven en el hogar de dsta. 
Los padres de Tarasoff presenlaron una deman- 


da y la Suprcma Corte de California coincidid 
en que los lerapeutas tienen la obligacidn de 
utilizar “precaucion razonable" para proteger a 
las potenciales vfetimas de sus clientes. Aun- 
que la resolucidn Tarasoff ha sufrido modi- 
ficaciones legislativas en muchos cstados, el 
impulso del caso aun sc mantienc: los clfnicos 
deben comunicar cualquier amcnaza seria tan- 
to a la vfetima potential como a las autoridades 
competentes, o a ambos. 

Por ultimo, el clfnico debe considerar el 
bicncstar del cliente cuando decide liberar infor- 
macidn, en especial cuando dste es un menor 
que no puede dar su consentimiento volunlario 
e informado. Cuando sea apropiado, los profe¬ 
sionales deben informar a sus clientes de los 
Ifmites legates de la confidencialidad. 

DESTREZA DEL USUARIO DE PRUEBAS 

Varios principios reconocen que el usuario de 
una prueba debe aceptar la responsabilidad ul¬ 
tima de la aplicacidn apropiada de las mismas. 
Desdc un punto de vista prActico, csto significa 
que la persona que emplca una prueba debe te¬ 
nor el entrenamiento adccuado en evaluacidn y 
teorfa de mcdicidn. El usuario debe poseer la 
dcstreza necesaria para valorar las pruebas psi- 
coldgicas en cuanto a la cxactitud de su estan- 
darizacidn, confiabilidad, validez, precisidn 
intcrprclati va y otras caracterfsticas psicorndtri- 
cas. Esta norma es de particular importancia en 
Areas como la sclcccidn laboral, education es¬ 
pecial, examcn de personas con discapacidades 
u otras situaciones donde el impacto potencial 
cs cnorme. 

Los psicdlogos que tienen un entrenamien¬ 
to deficiente en los instrumentos elegidos, pue- 
den comcter graves errores de interpretation 
que danen a las personas examinadas. Lo que 
es mds, la utilizacidn inepta de pruebas puede 
exponer al examinador a sanciones profesio¬ 
nales y demandas de tipo civil. Un error comiin 
que se observa entre los usuarios sin expe- 
riencia es la interpretacidn demasiado eniusias- 
ta, patologizante, de los resultados de pruebas 
de personalidad (ejemplo de caso 15-3). 
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EjEMPLO DE CASO15-3. 

ENTUSIASMO EXTREMO EN LA IN7ERPRETACl6N DEL MMPI 


Un psicologo consultor sin experience ulilizaba de manera rutinaria el MMPI con propositos de 
seleccidn previa a la conlratacibn de los candidatos a agentes policiacos. Una candidala 
presenld una demanda subsecuentemente, alegando danos a causa del informe del psicdlogo. 
A la demandante, una mujer joven con amplio entrenamlento y antecedentes dentro del sistema 
de imposicidn de la ley, se le nego un puesto como oficial de policfa debido a que supuestamente 
lenia un perfil “defensivo” en el MMPI. Su perfil se enconlraba por completo dentro de Kmiles 
normales, aunque habia obtenido una puntuacldn T de 72 punlos en la escala K. En general se 
considera que la escala K es un buen (ndice de las actitudes defensivas durante la presentacidn 
de la prueba, en especial en valoraclones de salud mental con canalizaciones cllnlcas u 
hospitalarias. S6lo con propdsitos de una breve revisidn se dird quo las puntuaciones T en el 
MMPI de cerca de 50 son promedio, mienlras que las elevaciones de 70 o mayores se conslderan 
dignas de tomarse en cuenta. El psicdlogo consultor senalo la calitlcacldn elevada de la candidata 
en la escala K, conjeturando de manera precipitada que bsta era demaslado dofensiva y le 
advirtid al jefe de policia que no la conlratara. 

Lo que el psicdlogo no sabfa es que las calilicaciones elevadas en la escala K son 
extremadamente comunes entre los solicltantes a un empleo dentro del sistema policiaco. Por 
ejemplo, Hiatt y Hargrave (1988) encontraron que cerca de 25% de una mueslra de agentes 
policiacos produjeron perfiles del MMPI con escaias K en o por encima de una puntuacidn T de 
70. De hecho, los agentes exitosos dentro de la policia tendian a tener calilicaciones |mde 
elevadas en la escala K que los agentes “problemdticos"! En este caso, el usuario de la prueba 
no posefa los suflcienles conocimientos acerca de la ulilizacldn del MMPI en la seleccidn de 
personal. Su ignorancia de este elemento constituyd una violacldn a la dtica profesional. 
De manera incidental, el ca30 se arregld fuera de los tribunales mediant© una suma sustancial de 
dinero, to cual demuestra que las transgresiones al uso responsable de las pruebas pueden 
tener graves consecuencias legales. 


La dcstrezadd psicdlogoes particularmente 
important© cuando se utilizan los scrvicios de 
calificacidn c interpretacidn de pruebas. Los 
principios eticos de la American Psychological 
Association dejan poco lugar a las dudas: 

Los psicdloqos conservan la responsabilldad 
pertinent© de la apllcacidn, Interpretacidn y uti- 
lizacidn apropiadas de los Instrumentos de 
evaluacidn, ya sea que ellos mlsmos calitiquen e 
inlerpreten dlchas pruebas o que uldicen servi- 
cios automatizados o de otro tipo (APA, 1992a). 


Se refiere al lector al tema 15A, Evaluacidn psi- 
coldgica auxiliada por computadoras, para 
una mayor discusidn sobre el punto. 

CONSENTIMIENTO INFORMADO 

Antes de que se llevc a cabo la aplicacidn, cl 
usuario debe obtener el consentimiento infor- 
mado de las personas que realizardn la prueba 
o de sus representantes legates. En ciertos ca- 
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sos pueden hacerse excepciones al consenli- 
micnto informado; por cjcmplo, cn los progra- 
tnas dc pmcba obligatorios a nivcl estatal, cn 
las prucbas con grupos cscolarcs y cuando cl 
conscntimicnto es claramcntc implfcito (p. cj„ 
en pruebas para admisidn a la univcrsidad). El 
principiodcl consentimiento informado es (an 
importantc que el manual de Normas dcdica 
una norma especffica para 61: 

El consentimiento inlormado impiica que se ha 
Informado, en un lenguaje comprenslble, a las 
personas quo realizan la prueba o a sus repre- 
sentantes de las razones para la aplicacibn de 
pruebas, los lipos da eslas que se utilizarbn, el 
uso Indlcado y el rango de consecuencias male- 
riales de este uso indicado y de cual inlormaclon 
de las pruebas se darb a conocer y a qub perso¬ 
nas (AERA y cols., 1985). 

Incluso las personas jdvenes o con retraso men¬ 
tal deben rccibir una explicacidn dc las razo- 
ncs para la prueba. Por cjcmplo, cl examinador 
podrfa decir, "Voy a haccrte unas preguntas y a 
pedirtc que trabajes con algunos problemas para 
ver lo que puedes hacer y cncontrar en qud co- 
sas ncccsitas mas ayuda”. 

Desde un punto de visla legal, los tres cle- 
mentos del conscntimicnto informado incluyen 
divulgacitin, compctencia y participacidn vo- 
luntaria (Melton, Petrila, Poythrcss y Slobogin, 
1998). El punto central dc la di vulgacidn es que 
el cliente reciba suficicntc informacidn (p. cj., 
accrca dc riesgos, bcncficios, difusion de in¬ 
formes) para tomar una decisidn cuidadosa acer- 
ca de continuar con la participacidn en cl 
proccso de prueba. La compctencia se rcficre a 
la capacidad mental dc la persona evaluada para 
dar su consentimiento. En general se suponc 
que existe compctencia a menos que la perso¬ 
na sea un nifio, un individuo muy anciano o 
tenga una discapacidad mental (p. ej„ retraso 
mental). En estos casos, sera necesario que un 
tutor proporcione conscntimicnto legal. Por ul¬ 
timo, la norma de participacidn voluntaria im¬ 
piica que la decision de realizar una baterfa de 
cvaluacion se otoiga de manera libre y no sc 
basa en una coaccidn sutil (p. ej., a los intemos 
se les promete una liberacidn anticipada si par- 
ticipan en pruebas para investigacidn). En la 


mayor parte de los casos, el examinador utiliza 
un formato de conscntimicnto informado como 
el que se mucstra cn la figura 15-3. 

PRUEBAS OBSOLETAS Y ESTANDAR 
DE CUIDADO 

El estdndar dc cuidado es un concepto indeler- 
minado que con frecuencia surge en las revi- 
siones profesionales o legates del ejercicio 
especffico dc profesiones relacionadas con la 
salud. incluycndo las pruebas psicol6gicas. El 
esUindar dc cuidado prcvalecicnle es aquel 
que es “cl comun, acostumbrado o razonablc" 
(Rinas y Clyne-Jackson, 1988). Para citar un 
ejemplo extremo, en mcdicina el estdndar de 
cuidado para una fiebre puedc incluir la admi- 
nislracidn de aspirina —pero no implicarfa la 
prbclica anlicuada de sangrar al pacicnte. 

Los profesionales que utilizan pruebas psi- 
coldgicas deben scr cautclosos de las pruebas 
obsolctas, porque su utilizaci6n podrfa violar 
cl cstdndar de cuidado prcvalcciente. Un caso 
a propdsito es el del MMPI contra el MMP1-2. 
Aunquc el MMPI-2 es una revisidn relativamen- 
te conservadora del muy cstimado MMPI, las 
mejorfas cn normas y construccidn de eseala 
son sustanciales. El MMPI-2 es el csldndar dc 
cuidado de la actualidad en la cvaluacidn de la 
psicopatologfa con base en el sistema MMPI. 
Los profesionales que continuan dependicn- 
do del MMPI original podrfan eslar cn posibi- 
lidad de que sc les demandc por ncgligencia, en 
especial si la interpretacidn dc la prueba resul- 
t6 cn afirmacioncs interpretalivas enganosas o 
en un diagndstico incorrecto. 

Otra cuestidn relacionada con cl cstindar 
de cuidado es la utilizacidn de resultados de 
una prueba que son obsoletos para el prop6sito 
actual. Dcspuds de todo, las caracterfslicas y 
rasgos individuals muestran un cambio valido 
a travds del liempo. Un estudiante que satisfa- 
ce los criterios de discapacidad para el apren- 
dizaje en el cuarto grado dc cstudios. podrfa 
mostrarenormes ganancias en rendimiento aca- 
demico que harfan que el diagndstico dc DA 
ya no fuera adecuado para el quinto grado. Los 
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Esie es un acuortJoentrc [Nombre del clieme] y [Nombredel profesional], Ph D .unpsicOtogocon licenciaenelesladode Illinois s« 

lo abenta a quo Dd haga preguntas aceica de la experiencia o credenciates prolesranalea en cualquler momento 

1. InlormaciOn general el propOsito de esta evaluacibn es proporoonar a su (medico, oriemador, terapeuta| la mlormaddn sobre m 
lundonamlento pslcotogico quo pooda ser util para el trabajo quo reallce con usted La evaluacidn impticard una breve entrevtsu y 
pruebas psicolrigicas Esto requenra de 3 a 4 boras de su tiempo 

2. Inlorme de pruebas la InlormaciOn relevanie de la entrevisla y los resullados de la prueba se resumlran en un inlorme por escrilo que 
se le enviard a su (medico, oriemador, lerapeuta] Los resullados de la prueba y el Inlorme se revisaran con usted en apfoximada/nanfe 
una semana 

3. Conlidencialidad el Inlorme no se proporclonara a nlnguna olra luonlo a monos quo usted lo solicite de manera lormal, por escnio 
Las excepciones a esta regia mduyen las slgulenles siluaciones su vlda o la de otra persona esta en peligro. se m forma de maltrato 
a abuse hacia nlbos o ancianos o existe una orden judicial para revelar el Inlorme 

4. Costo: se utitua una cuota por hora de S _para liegar a los honorarios lotaies Es posible que su pOliza de seguros medicos cubta 

pane o la lolalrdad de este costo. 0 costo total estimado de su evaluaoOn es de $_ 

5. Eleclos colalerales; aunque la mayorla de los Indlvlduos dlslrutan del proceso de la consults psicotOgica, algunos lo considsran 
incdmodo, en especial si los resullados de las pruebas Indlcan probtemas psicolOgicos Es apropiado que usted analice tus 
seniimientos con el examlnador Usled esta en llbertad de rebrar su consentimlento en cualquler momento duranle el cur so de las 
pruebas 

6. Negative a la evaluadOn usted Irene el derecbo a negarse a ta evaluaddn No se requrere que lleve a cabo esta vatoracidn a tin de 
contmuar trabajando con su (mddico. orientador, lerapeuta] No obstante, es mas probable que su tratamiento sea efectlvo si partcips 
en esta evaluaddn Si asl lo soliota, anallzaremos las opciones de canalizaddn para usted 


Nombre del cliente Fecha 


Figure 15-3. Ejempto abreviado del Consentimiento Inlormado para la Evaluaddn Psicoldglca. 

Fuente: Adaptado y abreviado con autorizacidn de Gregory, R. J. (1999). Foundations ot intellectual assessment: 
The WAIS-tll and other tests In clinical practice. Boston: AByn & Bacon. 


resullados cn pruebas de personalidad pue- 
dcn ser incluso mas cambiantes. Una crisis per¬ 
sonal a corto plazo puede causar que un perfil 
del MMPI-2 parezca como una cordillera mon- 
tanosa. Una semana despuds, el perfil de esta 
prueba puede ser completamcntc normal. Es 
diffcil proporcionar directrices en cuanto a la 
“vida util" de los resullados de las pruebas psico- 
Idgicas. Por ejemplo, los resullados obtenidos 
muchos afios antes en la prueba GRE podrfan 
todavfa pronosticar de manera vdlida cl desem- 
pefio en la universidad, mientras que los resul- 
tados en cl Beck Depression Inventory del dfa 
de ayer podrfan darle informaci6n errdnea al 
terapeuta acerca del nivel actual de depresidn. 
El profesional debe evaluara nivel individual la 
necesidad de repetir la prueba. 

redacci6n responsable 

DEL INFORME 

Exccpto por las pruebas grupales, la prdclica 
de la evaluaddn psicoldgica culmina de mane¬ 


ra invariable en un tnformc por cscrito que cons- 
tituye un registro semipermanente de las con- 
clusiones de la prueba y de las rccomendaciones 
del examinador. La rcdaccidn efectiva del in- 
forme es una habilidad importante debido al 
impacto potencia! duradero del documento es- 
crito. Ilustrar las cualidades de la redacctdn 
efectiva del informc va mis alia del cspectro 
de este libro, aunque sf sc puede referir al lec¬ 
tor a unas cuantas fuentes (Gregory, 1999; 
Tallent, 1993). 

Los informes rcsponsablcs utilizan de ma¬ 
nera comun una redacci6n sencilla y directa que 
se aleja de la jerga y de los tecnicismos. La meta 
apropiada de un informe es proporcionar pers- 
pcctivas utiles acerca del cliente, ;no impresio- 
nar a la fuente de canalizaddn con la idea de 
que el examinador es una persona culta! Cuan- 
do Tallent (1993) sonded a mds de mil profe- 
sionalcs de la salud que haefan canalizacioncs 
para pruebas, uno de los encucstados declard 
su desprccio hacia los psicdlogos que “refle- 
jan su necesidad de brillar como un faro psi- 
coanalftico para revelar los oseuros y profundos 
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secretos que han observado". En un comenta- 
rio relacionado. los informes efectivos perma- 
necen dentro dc los Ifmilcs del conocimicnto 
del examinador. Por cjemplo: 

... nunca es apropiado que un pslcdlogo reco- 
mfondo que un cliente se somela a un proce- 
dimiento mbdlco especifico (como un rastreo de 
TC para un aparente tumor cerebral) o que reci- 
ba un fdrmaco en particular (como Prozac para 
la depresidn). Aunque la necesidad de un pro- 
cedlmlento especial parezea obvla (p. ej., los sin- 
tomas raflejan de manera acentuada el rapido 
Inicio de un padecimiento cerebral), la mejor 
manera de satrsfacer las necesidades del cliente 
consiste en recomendar una consults inmedia- 
ta con el profesional medico apropiado (p. ej.. 
neurologo o psiquiatra) (Gregory. 1999). 

En Ownby (1991) y Saltier (1988) puede cn- 
contrarsc oricntacidn adicional acerca dc la re- 
dacctdn eftcaz del informe. 

COMUNICACI6N DE LOS RESULTADOS 
DE PRUEBA 

Los individuos que se someten a pruebas psi- 
cologicas anticipan que los resultados se les co- 
tnunicaran. No obstante, es frecuente que los 
profesionalcs no incluyan una scstdn individual 
de informaetdn dc resultados como parte de la 
cvaluacidn. Una de las principales razones para 
la renuencia es una falta dc entrenamiento accr- 
ca de edmo proporcionar la informacidn de re¬ 
sultados. en especial cuando cstos parccen ser 
negativos. Por cjemplo, ^de qud manera le co- 
rnunica un clfnico a una cstudiantc universita- 
ria que su Cl es de 93, cuando la mayorfa de los 
estudiantes en ese medio obtienen califtcacio- 
nes de 115 o mayores? 

Proporcionar informacidn eftcaz y cons- 
tructiva a los clientes acerca de sus resultados 
de prueba es una habilidad desafiante que re¬ 
quiem aprendizaje. Pope (1992) enfatiza la rcs- 
ponsabilidad del clfnico para determinar que el 
cliente ha comprcndido dc manera adecuada y 
prccisa la informacidn que dste intentaba 
trasmitirle. Lo que es mas, es responsabilidad 
del clfnico el inspeccionar las reacciones ad- 
versas: 


6 EI cliente se encuentra excepcionatmente de- 
prlmido por las condusiones? 4 El cliente intiere 
de las condusiones que sugieren un traslomo dd 
aprendizaje que —como siempre ha sospecha- 
do— es “estupldo"? Utilizar un culdado escrupu- 
loso para llevar a cabo esta ovaluacion acerca 
de lo que ei diente comprende y de sus reaccio¬ 
nes ante la inlormacion de resultados no es me- 
nos importante que utilizar un cuidado adecuado 
en la aplicacidn do pruebas psicolbgicas 
estandarizadas: la aplicacidn de pruebas y la in- 
formacidn de resultados son aspectos igualmen- 
te importantes. lundamentales, del proceso de 
ovaluacion (p. 271). 

La informacidn de resultados apropiada y efec- 
(iva implica un didlogo dc intercambio en el 
que el clfnico cstima la manera en que el clien- 
tc ha percibido la informacidn y busca corregtr 
las intcrpretaciones potcncialmentc dahinas. 

Es frecuente que la informacidn de resul¬ 
tados tenga un efecto destructive cuando cl clf¬ 
nico no cuestiona las percepciones incorrectas 
de un cliente acerca de los resultados dc prue¬ 
ba. Considdrense en particular las pruebas dc 
Cl —un caso en el que muchas personas pon- 
deran las calificaciones de la prueba y las con- 
sidcran como un fndice dc valfa personal. Antes 
dc proporcionar los resultados de una prueba, 
se aconseja al clfnico investigar lo que el cliente 
entiende acerca del significado de las califtca- 
cioncs dc Cl. Despues de todo, el Cl es un 
trozolimitadodel funcionamiento intelectual: no 
valora un impulso o cardcter de algun tipo, tic- 
ne una precisidn de aproximadamente ± S pun- 
tos, puede cambiar a travds del liempo y no 
evalua muchos atributos importantes como crea- 
tividad, inteligencia social, capacidad musical 0 
habilidad atlbtica. Pero un cliente puede tener 
una perspectiva poco realista acerca del Cl y. 
por ello, podrfa llegar a condusiones errdneas 
al escuchar que su calificacidn es de “s6lo" 93. 
El profesional cuidadoso obtendra del cliente 
sus perspectivas y las cuestionard cuando sea 
necesario antes de proceder. En Gass y Brown 
(1992) y en Pope (1992) pueden encontrarsc 
olios conceptos acerca de la informacidn dc 
resultados. 

Finn y Tonsager (1997) van mds alld del 
pronunciamiento general acerca de la evitacidn 
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del daiio cuando se proporciona un informe dc 
rcsullados sobrc pruebas, al presenlar la pcrs- 
pcctiva fascinante de que la informacidn accr- 
ca de dstos debenan tener cfcclos lerapeuticos 
direclos c inmedialos para los individuos que 
experimentan problemas psicologicos. Enotras 
palabras, cstos autores proponen que la evalua¬ 
cidn psicoldgica es una forma dc intervencidn 
a corto plazo, no s61o una base para reunir in¬ 
formacidn que postcriormentc se utilizarfi para 
propdsitos lerapeuticos. En un csludio (Finn y 
Tonsager, 1992), se cxaminaron los cfeclos de 
una evaluacidn psicoldgica breve en los clien- 
tcs dc un centra de orientacion universitaria. 
Treinta y dos estudiantes tomaron parte en una 
entrevista inicial, respondicron al MMPI-2 y 
despuds recibieron una scsidn de una hora con 
la informacidn dc rcsullados, llevada a cabo de 
acuerdo con un mdtodo elaborado por Finn 
(1996). Un grupo de comparacidn de 29 cstu- 
diantes se sometid a la entrevista y recibid la 
misma cantidad dc psicotcrapia dc apoyo, no 
directiva, en vez de la informacidn de los re- 
sultados dc la prueba. Los clientes en cl grupo 
de evaluacidn con el MMPI-2 mostraron una 
mayor disminucidn en la angustia sintomatica 
y un mayor aumentoen autoestima, inmediata- 
mente despuds de su sesidn de informacidn de 
rcsullados y tambidn despuds dc dos semanas, 
con icspecto al grupo de comparacidn. EJ grupo 
de informacidn dc rcsullados tambidn sc mos- 
trd mas esperanzado acerca dc sus problemas 
despuds dc la evaluacidn breve. Eslas conclu- 
siones ilustran la importancia de proporcionar 
informacidn cuidadosa y constructiva dc los 
rcsullados dc prueba, mds que dc lanzarse a 
una rcvisidn rutinaria dc las conclusiones. 

CONSIDERACION DE LAS DIFERENOAS 
INDIVIDUALES 

Todas las organizaciones profesionales que 
ticncn que ver con las pruebas psicoldgicas des- 
tacan cl conocimiento de las diferencias indi¬ 
viduates y el respeto hacia dstas. La American 
Psychological Association incluye cl siguientc 
como uno dc los scis principios gufa: 


Principle O: respeto hacia los derechos y digni- 
dad de las personas... Los psicologos estrin 
consciontes de las dilerencias culturales, indivi¬ 
duates y de rot, incluyando aqudllas debidas a la 
edad, gdnero, raza. origen dtnico y nacional, reti- 
gion, orientacion sexual, discapactdad, idioma y 
nrvel socioecondmlco. Los pslcdlogos intentan eli- 
minar el ofecto sobre su trabajo de los prejuicios 
basados en esos factores y no participan volun- 
tariamente o toteran las prdclicas discriminatorias 
injustas (APA, 1992a). 

La importancia dc este principio para las pruebas 
psicoldgicas cs que sc espera que los profesio¬ 
nales sepan cuando una prueba o interprclaci6n 
pueda no ser aplicablc debido a factores como 
edad, gdnero, raza, origen dtnico y nacional, 
rcligidn. orientacidn sexual, discapacidad, idio¬ 
ma y nivel socioccondmico. Se puede ilustrar 
este punto con un cstudio clfnico presentado 
por Eyde y colaboradores (1993). Un psicdlo- 
go cvalud a un hombre de 75 anos de edad a 
pcticidn de su esposa, quien habia observado 
problemas de memoria. El psicdlogo aplied 
un examen del cstado mental y una prueba de 
inteligencia dcstacada. El desempeno en el exa¬ 
men dc cstado mental era normal, pero las cali- 
ficacioncs en la prueba de inteligencia revclaron 
una fuerle discrepancia entre las subpruebas 
verbales y aquellas que median capacidad es- 
pacial y vclocidad de proccsamicnto. El psicd¬ 
logo interpretd este patrdn como indicacidn dc 
deterioro del funcionamicnto intelcctual del ma- 
rido. Por desgracia, esta interprctacidn sc basd 
en cl uso errdneo dc puntuaciones cstandar sin 
correccidn para edad. Adcmds, el psicdlogo 
tampoco cvalud la prcsencia dc depresidn que, 
segun se sabe, es causa dc que el desempeno 
visoespacial tenga una disminucidn notable 
(Wolff y Gregory, 1992). De hecho, una serie 
dc valoracioncs posteriorcs revelaron que esta 
persona era un hombre pcrfcctamente sano de 
75 anos dc edad. El psicdlogo no lomd en con- 
sidcracidn la importancia de la edad de este 
sefior y su situacidn emocional cuando inlcr- 
pretd la prueba de inteligencia. fiste fue un error 
costoso que produjo que el cliente y su esposa 
sufrieran de preocupaciones sustanciales inne- 
cesarias. 
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g' : PRUEBAS CON MINORIAS 
CULTURALES Y UNGUISTICAS 

ANTECEDENTES Y NOTAS HIST6RICAS 

Las personas dc minorfas etnicas (dc origen no 
europco) constituyen en la actualidad ccrca de 
25% dc la poblacidn en EUA y se estima que 

I abarcaran mas de 50% dentro de varios decc- 
nios (Dana. 1993). No obslanic. la tarea de la 
evaluacidn con pruebas se basa casi por com- 
pleio en los esfuerzos de psicologos de raza 

I blanca que llevan una pcrspcctiva anglocsta- 
doumdense a su labor. No puede darsc por sen- 
lada la idoncidad de las pruebas cxistcntes para 
valorar a poblaciones diversas. La evaluacidn 

I de individuos que provicncn de minorfas dtnicas 
hacc surgir importanlcs dudas, en especial cuan- 
do los resuliados dc una prueba se traducen 
en dccisioncs de asignacidn o en olios rcsulla- 
dos dclicados, como ocurrc por lo comun den¬ 
lro de inslituciones educativas. 

Como se scnald cn el capftulo I, Historia 
dc las pruebas psicoldgicas, los pioneros en el 
movimiento de las piucbas ignoraron cn gran 
medida el impacio dc los antcccdcnics cultura- 
Ics sobre los resuliados dc dstas. Por cjcmplo, 
en cl dcccnio dc 1920, Henry Goddard conclu- 
y 6 que la inlcligencia del inmigrante prome- 
dio era alarmantemenlc baja, “quizis al grado 
de mordn”. Sin embargo, Ic resld importan- 
cia a la probabilidad dc que las difcrcncias lin- 
glifsticas y culturales pudieran explicar las 
bajas calif icaciones en una prueba de los inmi- 
grantes. 

Quiza como un rechazo cn contra de estos 
primeros mdtodos, a inicios de la ddcada de 
1930 los psicdlogos preseniaron una mayor seo- 
sibilidad a las variables culturales cn la prdeti- 
ca dc las pruebas. Un rcsplandeciente ejemplo 
en este scnlido fue Stanley Porteus, quien em- 
prendio una investigacidn de gran alcance accr- 
ca del temperamento c inteligcncia de los 
pueblos aborfgenes austral ianos. Porteus (1931) 
utilizes muchos instrumentos tradicionales (di- 
sefios con cubos, laberintos, retencidn de dfgi- 


tos) pero para erddito de este investigador, tam- 
bidn diseno una medida ccoldgicamente vilida 
de la inteligencia para este grupo; a saber, re- 
conocimicnto de hucllas dc pisada. Micntras 
que los aborfgenes evaluados tuvieron un des- 
ernpeno dcficientc cn las pruebas curocdntricas. 
su capacidad para rcconocer huellas en folo- 
graffa estaba a la par con otros grupos racialcs 
estudiados. Aun asf, Porteus se mostrd muy 
conscicnte en cuanto a que su procedimicn- 
to todavfa podrfa representar un impedi¬ 
ment para los aborfgenes: 

La lolografia do una huella de pisada no es lo 
mismo que la pisada en si y os muy probable 
que varias senales que utiliza el rastreador abo- 
rigon osten ausentes en una lotogralia. Las pro- 
lundldades diversas de partes de la impresidn 
del pie no son visibles en la lotogralia y puede 
ser que las peculiaridades individuates, diferen- 
tes a la forma y tamano generales de la huella, 
no resalten de manora dara. De aqui que se deba 
esperar que los individuos aborfgenes se encuen- 
Iren en cierta desventaja al equiparar estas loto- 
gralias de huellas con el reconocimiento de las 
huellas en si (pp. 399-400). 

De manera similar, DuBois (1939) cnconlrd que 
los nifios dc los indfgenas pueblo presentaban 
una capacidad superior en la prueba del dibujo 
dc un caballo, que el autor diseno de manera es¬ 
pecial para evaluar la capacidad mental de estos 
nifios, micntras que su desempefio era mcnos ade- 
cuado cn la prueba tradicional de Goodenough 
(1926) del Dibujo de la Ftgura Humana. Desde 
estos primeros cstudios, los psicdlogos han 
mantenido un especial interds en el impacto del 
lenguaje y la cullura en el significado dc los 
resuliados de una prueba. 

IMPACTO DE LOS ANTECEDENTES 
CULTURALES EN LOS RESULTADOS 
DE UNA PRUEBA 

Los profesionales necesilan apreciar que los 
antecedentes culturales de las personas cvalua- 
das tendrin un impacto en todo el proceso de 
evaluacidn. Por esta razdn, Sattler (1988) acon- 
seja que los psicdlogos dcdicados a la evalua- 
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cidn enfoquen su (area desde una perspectiva 
plural: 

Los grupos culturales pueden variar coo respec- 
(o a valoros culturales (to cual se derive en parte 
del choque, discontinuldad o contlicto culturales); 
lenguaje y malices en el estilo del lenguaje; pers- 
pectlvas acerca de la vida y de la muerte; roles 
de los miembros de la familia; estrategias de 
solucion de problemas; actitudes hacia la edu- 
cacidn. salud mental y enlermedad mental; y 
etapa de aculluracion (el gmpo puede seguir va- 
lores tradlctonales, aceptar los valores del grupo 
dominants o estar en algun punto ontre ambos). 

El examinador debe adoptar un marco de refe¬ 
renda que le permits comprender cOmo ciertas 
conductas tlenen sentido dentro de cada culture 
(p. 565). 

A pesar de rcconocer el impacto de las diferen- 
ctas culturales sobrc las pruebas, tambidn cs 
importante evitar las generalizacioncs estereo- 
ttpicas cxccsivas. Por ejemplo, con frecuencia 
sc sefiala quc los nativos estadounidenses 
presentan un concepto distintivo accrca del 
ticmpo. cnfatizando el prescntc en contrapo- 
sicidn a la orientacidn hacia cl futuro quc es 
tan poderosamente formativa en la socicdad 
estadounidcn.se de raza blanca, de clase media 
(Panigua. 1994). Una posible implicacidn de 
esta diferencia cultural es que los lfmitcs de ticm¬ 
po podn'an no representar lo mtsmo para un niiio 
indtgena estadounidcnse que para uno de la 
cultura prcdommante. Quizes el nihodc mino- 
rta dcsobcdezca las instrucciones de una sub- 
prueba y trabaje a un paso cuidadoso y medido. 
en vcz de buscar las soluciones rdpidas. Por 
supuesto, es posible quc este nino obtenga en- 
tonces una calificacidn engafiosamente baja en 
csa medida. 

No obstante, al afirmar las diferencias cul¬ 
turales, los examinadores nccesitan evitar cl 
peligro de los estereotipos. La cultura no es mono- 
Iftica. Cada persona es unica. Algunos tndige- 
nas estadounidenses cxhibirdn una orientacion 
distintiva acerca del tiempo. pcro quizd la ma- 
yorfa no lo hagan. El reto para el profesional 
consistc en observar los dctalles clfnicos del de- 
sempeno e identificar los matices culturales 
de la conducta que ayudan a determinar los re- 
sullados de una prucba. 


Un ingenioso csludio de Moore (1986) ilus- 
tra de manera poderosa la importancia de los 
antccedcntes culturales para comprender el des- 
empeno en una prucba de los individuos de 
minorias etnicas. Esta autora no sdlo compard las 
calificacioncs en pruebas de inteligencia, sino 
tambidn la manera cualitativa de responder a 
las dcmandas de la prueba de dos grupos de 
nifios adoptivos afroestadounidenses. Un gru¬ 
po lo constitufan 23 nifios adoptados de modo 
transracial por familias de raza blanca, de clase 
media. El otro lo formaban 23 niiios adopta¬ 
dos de manera intrarracial por familias afrocs- 
tadounidcnscs. A todos los ninos se les habfa 
adoptado antes de los dos afios de edad y los 
antccedcntes de las familias adoptivas eran si- 
mi lares en tdrminos de cducacidn y clase so¬ 
cial. Asf, las diferencias en calificacioncs y 
conductas de prueba podfan atribuirse princi- 
palmcntc a aquellas en antecedentes culturales 
que surgfan del hecho de que un grupo habt'a 
sido adoptado por familias afroestadounidenses, 
mientras que al otro lo habfan adoptado fami¬ 
lias de raza blanca. Las pruebas y obscrvacio- 
nes las llevaron a cabo dos examinadoras 
afroestadounidenses, “ciegas” acerca del pro- 
pdsito del estudio. Los nifios adoptados de ma- 
ncra transrracial y examinados de los 7 a los 10 
anos de edad obtuvieron un Cl promedio de 117 
en el WISC, en comparacidn con un Cl prome¬ 
dio de 104 para los nifios adoptados de manera 
tradicional. Estos rcsultados de Cl no fucron 
notables, en la medida en que Scarr y Weinberg 
presentaron conclusioncs similares afios antes. 

El sorprendente e informativo resultado 
fue que los dos grupos de nifios mostraron 
conductas cualitativas muy diferentes duran¬ 
te la prueba. Como grupo, los nifios con califi- 
caciones menores de Cl (aqudllos adoptados por 
familias afroestadounidenses) estaban en me- 
nor probabiltdad de claborar de manera espon- 
t^nea sus rcspucstas de trabajo y en mayor 
probabilidad de simplemcnte negarsc a respon¬ 
der cuando se les presentaba una demanda de 
la prucba. Moore (1986) ofrecid las siguientes 
inlerpretaciones: 

La tendencia de los ninos a elaborar de manera 

©spontanea sus respuestas de trabajo puede set 
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un fndice muy importante do su nivel de particl- 
pacibn en el desempeno de la (area, sus esirate- 
gias de solucibn de problemas, nivel de motiva- 
cibn para generar una rospuosla correcla y nivel 
de adaptacibn a la slluacibn eslandarizada de 
prueba[...] Aunque la respuesla terminal no tra- 
bajada se considera como incorrecta, de hecho 
no proporciona ninguna documentation empiri- 
ca de que to que el nlbo sabe o no, o de lo quo el 
nifio puede o no puede hacer. La unica Informa¬ 
tion disponible es que el nifto no responde a la 
demanda (p. 322), 

La leccion esencial dc estc estudio es que las 
diferencias con bases culturalcs cn cuanto a 
cstilo dc respuesla pueden tener por rcsullado 
la ocultacidn dc la capacidad subyacentc de al- 
gunas personas cvaluadas. Sicmpre es aconsc- 
jable hacer interprctaciones cuidadosas dc los 
resultados dc una prueba, pero esto ticne par¬ 
ticular importancia cn el caso de indi viduos que 
provienen de antecedcntes cultural o lingiifsti- 
camcnte di versos. 

La influencia de los factores culturales no 
sc limita al desempeno de los nihos cn una prue¬ 
ba, sino que tambi£n abarca a los adultos. 
Terrell. Terrell y Taylor (1981) investigaron los 
cfcctos de la confianza/desconfianza racial sobne 
las calificaciones cn pruebas dc inteligencia de 
estudiantes universitarios afroestadouniden- 
ses. Los investigadores identificaron a los cstu- 
diantes afrocstadounidenses con niveles altos 
y bajos de dcsconfianza hacia los de raza blan- 
ca. Con un disefio de 2 x 2. a la mitad dc cada 
grupo se le sometid a una prueba individual dc 
inteligencia aplicada por un examinador de raza 
blanca, mientras que a la otra mitad un exami¬ 
nador afroestadounidense les aplied la prueba, 
Como se pronostied, el andlisis dc varianza no 
reveld diferencias en los efectos principales de 
la raza del examinador (blanca contra afroesta¬ 
dounidense) o del nivel de dcsconfianza (alto 
contra bajo; figura 15-4). Pero se reveld una 
interaccidn sustancial; es dear, el grupo dc alta 
dcsconfianza y con un examinador afroestado¬ 
unidense obtuvo calificaciones mucho mejores 
que cl grupo de alta desconfianza con un exa¬ 
minador dc raza blanca (Cl promedio dc 96 
contra 86, respectivamente). Dicho de maneru 
sencilla, la desconfianza cultural entre los 
afrocstadounidenses se asocid con calificacio- 
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Figura 15-4. Puntuacionos madias de Cl do estudian¬ 
tes afroestadounidenses en luncibn de la raza del exa¬ 
minador y de la desconfianza cultural. 

Fuente: Basado en datos de Terrell. F., Terrell, S. yTaylor, 
J. (1981). Effects of race of examiner and cultural mis¬ 
trust on lire WAIS performance of Black students. Journal 
of Consulting and Clinical Psychology, 49, 750-751. 


ncs significativamcnte mcnores dc Cl, pero solo 
cuando el examinador era de raza blanca. 

Para ilustrar aun mas las influcncias cultu¬ 
rales, Steele (1997) ha propuesto una teorfa 
accrca de que los cstcrcotipos dc la socicdad 
sobre los grupos influyen sobre el desempeno 
intelectual inmediato y tambidn el desarrollo a 
largo plazo dc la identidad dc los miembros in¬ 
dividuates del grupo. Steele ha aplicado esta 
teorfa tanto a mujeres —donde los estereotipos 
afcctan su aprovechamicnto cn matcmbticas y 
ciencias naturalcs— como a afroestadouni- 
denscs —donde los estereotipos aparente- 
tnente disminuyen su desempeno en pruebas 
estandarizadas. Aquf se analiza su invcstigacidn 
sobre la amenaza del estcreotipo con estudian¬ 
tes universitarios afroestadunidenses (Steele y 
Aronson, 1995). 

La idea dc la arnenaza del estereotipo es, 
en esencia, una versidn compleja de una prolc- 
cfa autocumplida. Los investigadores la dcfi- 
nen como la amenaza dc confirmar, como 
caractcrfstica propia, un estereotipo negativo 
acerca del propio grupo. Por ejemplo, con base 
en datos publicados y la cobcrtura de medios 
de informacidn accrca de la raza y las califi¬ 
caciones de Cl, se ha estereotipado a los afro- 
estadounidenses como poseedores de menor 
capacidad intelectual que los dembs. En conse- 
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cucncia, cada vez que sc cnfrentan con pruc- 
bas de inteligcncia o aprovcchamiento acad<5- 
mico, los individuos de este grupo pueden 
pereibir que existc cl ricsgo dc confirmar el 
estcreotipo. A corto plazo, la hipbtesis es que 
la amenaza del estcreotipo disminuira el des- 
empeiio en una prueba debido al aumento en 
ansiedad y otros mecanismos. A largo plazo, 
puede tencr el impacto adicional de presionar a 
los cstudiantes afrocstadounidenscs a “romper 
con la identificacidn como mancra dc protcgcr- 
sc" al obtener logros en la cscuela y dreas inte- 
lectuales rclacionadas. 

Steele y Aronson (1995) llcvaron a cabo 
una serie de cuatro estudios para valorar la hi- 
pdtesis dc la amenaza del estcreotipo. Todas las 
invcstigaciones confirmaron la hipdtcsis. En 
este caso sc cnfoca la atencidn en el primer cs- 
tudio, en el que sc aplied una prueba de 30 mi- 
nutos a estudiantes afroestadounidenses y dc 
raza blanca, compuesla por rcactivos diftcilcs 
de la seccidn verbal del Graduate Record 
Examination (Examen dc registro del posgra- 
do). Se asignd de mancra alcatoria a los estu¬ 
diantes de ambos grupos raciales a una de tres 
condiciones de prueba: amenaza del estereoti- 
po, en la que la prueba sc dcscribid como un 
diagnostico de la capacidad verbal individual; 
control, en la que dsla fue dcscrita s6lo como 
herramienta dc investigacidn; y control-desa- 
Ifo, en la que se le describid sdlo como herra¬ 
mienta de investigacidn, pero a las participantes 
se les exhortd a “asumir el desaffo de mane- 
ra scria”. Las calificaciones en la prueba verbal 
se ajustaron (andlisis de covarianza) con base 
en las puntuaciones previas de aprovechamicn- 
to, a fin dc eliminar los cfectos dc difcrcncias 
preexistentes entre grupos. 

Las diferencias raciales fucron pequenas 
y no significativas en las condiciones control y 
control-desafio. mientras que los individuos afro- 
estadounidenses obtuvicron calificaciones 
mucho mds bajas que los de raza blanca en la 
condicion de amenaza del estereotipo (figu- 
ra 15-5). En otros estudios, Steele y Aronson 
(1995) investigaron cl mecamsmo dc media- 
cidn a travds del cual la amenaza del estereoti¬ 
po provocaba que los afroestadounidenses tu- 



Arnerw .1 del Sdlo control Conlrol deaatlo 
estereotipo 


Figure 15-5. Promedlo de reactivos verbales correctos 
para personas de raza blanca y afroestadounidenses 
bajo tres condiciones. 

Fuente: Basado en datos de Steele. C. M. y Aronson. 
J. (1995). Stereotype threat and the intellectual test per¬ 
formance of African Americans. Journal ot Personality 
and Social Psychology, 69, 797-811. 

vieran calificaciones mas bajas en pruebas estan- 
darizadas. Los dclallcs van mds alia del espcctro 
de este libro, pero la conclusidn general no: 

Nuestra mejor evaluacion es que la amenaza del 
estereotipo causa una insuficiencia del process - 
miento muy pareclda a la provocada por otras 
preslones evaluatlvas. Los participantes con 
amenaza del estereotipo ocuparon mds tiempo 
en responder a menos reactivos de manera mds 
imprecisa —probablemente como resultado de 
alternar su atencidn entre tratar de responder a 
los reactivos y de evaluar el significado para sf 
mlsmos de su frustracidn (Steele y Aronson, 
1995, 809). 

En resumen, los autores proponen una pcrspcc- 
tiva sociopsicoldgica acerca del significado de 
las menores calificaciones de prueba de los afro- 
estadounidenscs y quizd lambien de otros gru¬ 
pos amcnazados por el estcreotipo. Su punlo 
de vista enfatiza que los resultados dc una prue¬ 
ba no residen dentro de los individuos. Las cali¬ 
ficaciones de una prueba ocurren dentro de un 
complejo campo sociopsicoldgico en cl que in- 
fluyen potencialmentc la historia nacional, los 
confliclos de raza y muchas otros factores sutiles. 
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evaluao6n de minorias 

CULTURALES Y LJNGUIST1CAS 

En los ultimos 50 anos, cs cada vez m.1s frc- 
cuente que el campo de la psicologfa haya rc- 
conocido quc pucdc scr nccesario utilizar 
practicas especializadas para lograr un examen 
equitativo con las minorfas culturalcs y lin¬ 
gUfsticas. La sensibilidad a las cuestiones unicas 
que se enfrentan en la evaluacidn de mino¬ 
rias surgid por vez primera en el decenio de 1960 
cuando la Society for the Psychological Study 
of Social Issues publicd las pautas para cxami- 
nara ninos de minorfas. De manera mils rccien- 
te, la profesi6n de la psicologfa ha reitcrado su 
prcocupacidn en cuanto a la validcz de la cva- 
luacidn de minorfas culturales y lingUfsticas al 
publicar pautas para quicnes proporcionan ser- 
vicios psicoldgicos a poblaciones minoritarias 
(APA, 1993). Estas pautas amplias proporcio¬ 
nan metas que representan una aspiration (p. ej., 
sc espera que los cxaminadorcs rcconozcan la 
diversidad cultural), pero que representan muy 
poco en el senlido de consejos espccfficos para 
el profcsional dc la evaluacidn. Como resulta- 
do ha aparccido una oleada de influycntes li- 
bros y artfculos, cada uno de los cualcs ofrece 
comentarios cuidadosos acerca de la evaluacidn 
multicultural (p. ej., Lam, 1993; Suzuki, Meller 
y Pontcrollo, 1996; Rogers. 1998). Como sc cx- 
presa a continuation, en csta litcralura sc puc- 
den identificar cicrtos temas aleccionadorcs. 

Una consideracidn preponderantc cs que 
las barreras lingUfsticas pueden inhibir el 
descmpeno en una prueba de los individuos de 
minorfas. Valdes y Figueroa (1994) expresan el 
problema de la siguiente manera: 

Cuando un indlvfduo bilingue so enfrenta con 
una prueba monotingue, desarrollada por indivi¬ 
duos monollngues y cuyas estandarizacibn y 
normas se establecieron con una poblacidn mo- 
nolmgue, tanto a la persona que contests la prue¬ 
ba como a la prueba en st se les pide hacer algo 
quo no pueden. La persona bilingue que presen- 
la la prueba no puede lener el mismo desempeflo 
que un individuo monotingue. La prueba monolin- 
gue no puede "medir" en el otro idioma (p. 172). 

Lo que esto signifies desde un punto de vista 
prdetico es que, incluso aunque un niho bilin- 


gOc de minorfa tenga fluidez en inglds, aun asf 
una prueba en este idioma podrfa subestimar 
su verdadero nivel de capacidad. El examina- 
dor sensible reconocerfi esta posibilidad al in- 
terpretar los rcsultados dc la prueba. 

Podrfa parecer que existe la posibilidad dc 
utilizar a un intdrprete de la lengua malerna 
para facilitar la evaluacidn de las personas 
cuyo idioma principal no sea cl ingles. En ge¬ 
neral, los especialistas en pruebas no aconse- 
jan esta prdctica porque los intdrpretes pueden 
sustituir palabras, hablar en un dialecto dife- 
rente o dar sugercncias sutilcs quc influycn 
las respuestas de los individuos evaluados 
(Rogers, 1998). Serfa prcferible un psicdlogo 
bilingUe bien entrenado, pero incluso esta 
prdctica les parece problemdtica a algunos 
(Figueroa, 1990). 

La opci6n preferida consiste en utilizar 
pruebas traducidas a la lengua matema de la 
persona evaluada y cuyas normas se hayan es- 
tablecido en subpoblaciones relacionadas. Por 
desgracia, cxisten rclativamentc pocos instru- 
mentos disponibles para este propdsito. Las 
versioncs en cspahol de pruebas destacadas son 
la excepcidn a esta situacidn. Algunos ejem- 
plos incluyen la Escala dc Inteligencia Wechsler 
para Nifios-Revisada de Puerto Rico (EIWN-R 
PR), .una versidn en cspahol del WISC-R, y la 
prueba TEM AS, una versidn en espanol del Test 
dc Apcrccpcidn Temutica que se compone de 
Idminas cstfmulo nuevas y relacionadas 
culturalmcntc. La EIWN-R PR es una adapta- 
cidn al espadol del WISC-R rcalizada en 1993. 
Las normas de csta prueba sc obtuvicron con 
2 200 niiios puertorriquefios entre los 6 y 16 
anos, 11 meses de edad. La EIWN-R PR con- 
serva la eslructura y contenido originalcs del 
WISC-R, ademtis de proporcionar instmccio- 
nes en cspahol para la aplicacion y calificacidn 
dc las 12 subpruebas. El TEMAS sc analizd de 
manera breve en el tema 13B, Tdcnicas pro- 
ycclivas. 

Adcmds dc las posibles barreras lingUfsti¬ 
cas, los individuos de minorfas pueden exhibir 
una falla dc elaboracidn para presentar prue¬ 
bas, lo cual agrava todavfa mds su situacidn 
desventajosa. Desde una pcrspcctiva hispana. 
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Padilla y Medina (1996) hacen las siguienlcs 
observaciones: 

Es bastante probable que los estudiantes tie mi- 
norfas se encuenlren menos familiarizados con 
las pruebas estandanzadas de rendimiento y, por 
tanto, tengan menos habllidades asocladas con 
responder pruebas que los estudiantes de ma- 
yorfa, qulenes se ban vtsto expuestos a las prue¬ 
bas estandarizadas durante un tiempo largo. Otra 
consideracibn es que los padres mbs educados. 
que tienen conocimientos acerca de cbmo res¬ 
ponder a las pruebas, partlclpen mas en un en- 
trenamiento de sus hijos para instrulflos sobre 
las estrateglas que se conocen como utiles en las 
pruebas de opcion multiple y sobre la importan- 
cia de equilibrar la velocidad y la preclsibn en 
pruebas de tipo objetivo. Por lo general, este tipo 
de entrenamienlo y practica no so encuentra en 
los hogares de ninos de nlvel socioeconbmico 
mbs bajo. debido a que los padres pueden Igno- 
rar las prbcticas adecuadas que se asocian con 
presenter pruebas (p. 14). 

No existe otro remedio inmediato para cste tipo 
de problema que rcconocer que las calificacio- 
nes en una prueba de los individuos de mino- 
rfas pueden reflejar una falta de claboracidn 
hacia las pruebas. 

La probabilidad de quo las barreras lingUfs- 
ticas y la falta dc claboracidn hacia las pruebas 
influya en los resultados de las minorfas es un 
fuertc argumento en favor de utilizar un enfo- 
que multldisciplinario para la cvaluacidn. 
Cuando la evaluaci6n representa las pcrspecti- 
vas multiples de varias disciplines (p. ej.. espe- 
cialistas en psicologia, habla y lectura) es menos 
probable que los resultados errdneos de la eva- 
luacidn que provengan de cualquier discipline 
por sf sola deriven en un pcrjuicio. Esto es par- 
ticularmente cierto en la cvaluacidn escolar de 
ninos que provienen dc antecedenles culturalcs 
y lingUfsticos diferentes. Rogers (1998) reco- 
mienda que la evaluacidn de ninos dc minorfas 
proceda de las siguientes maneras: 

1. Evaluaciones multidisciplinarias que impli- 
quen la obtencidn de informacidn a partir de 
una vanedad de fuentes y metodos; 

2. Evaluaciones llcvadas a cabo en la lengua 
matema del nifto. asf como en inglds; 


3. Evaluaciones que protejan a los nitios de las 
prbcticas dc seleccidn y administracidn que 
sean discriminatorias en sentido racial y cul¬ 
tural; 

4. Proccdi mientos especificados de manera cla- 
ra para evaluar a nifios de antecedentes lin¬ 
gUfsticos diferentes; y 

5. Consentimicnto informado de los padres y 
nolificacidn a los mismos acerca de sus dc- 
rechos a los proccdimientos Icgales estable- 
cidos. 

Estos asuntos nos recucrdan una vez mbs que 
la prbctica dc la cvaluacidn ocurre dentro dc un 
contcxto social cargado de valores. El exami- 
nador capaz presenta una sensibilidad hacia la 
diversidad cultural y lingUfstica en la aplica- 
ci6n c interprctacidn de pruebas psicoldgicas. 


REITERACION: USO RESPONSABLE 
DE LAS PRUEBAS 


Se regresa ahora a los verdaderos dilemas de la 
aplicacidn de pruebas que se mencionaron al 
inicio del tema. El lector recordarb que el pri¬ 
mer dilema tenfa que ver con el hccho de si un 
psicdlogo responsable puede negarse a dar in- 
formacidn sobre resultados de los candidatos a 
agentes dc la poliefa que se canalizan para un 
examcn de selecci6n previo a su contratacidn. 
Dc manera sorprendente, la respuesta para esta 
pregunta es Sf. Bajo circunstancias normales, 
un profesional debe explicate los resultados de 
la cvaluacidn al clicnte. Pero cxisten excepcio- 
nes, como lo cxplica el Principio 2.09 del C6- 
digo 6tico de la APA: 

A menos que. de antemano. se explique con cla- 
ridad a la persona evaluada la naturaleza de la 
relacldn y se llmite la entrega de resultados (como 
en atgunas valoraciones de consultoria or- 
ganizacional, seleccibn previa a la contrataclon 
o de seguridad y evaluaciones (orenses), los psi- 
cologos garantizan que se proporcionarb una ex- 
pticacibn de resultados en la que se utlllce un 
lenguaje que razonabtemente pueda compten- 
der la persona evaluada u otra que tenga autori- 
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zacion legal para represenlar al clients {APA, 

1992a). 

El scgundo dilema tenfa quc ver con un orien- 
tador quc continuaba utilizando cl MMPI aun- 
que el MMPI-2 cstaba disponible dcsdc hacfa 
varios anos. *,La negaliva del orientador a utili- 
zar cl MMPI-2 es un muestra de incumplimiento 
de las normas profesionales? La respucsta a csta 
pregunta es probablemcnte Sf. El MMPI-2 tic- 
ne validacidn adecuada y constiluye una mejo- 
rfa significativa con respecto al MMPI. Como 
se mcnciond antes, cl MMPI-2 cs ahora el 
estdndar de cuidado en la cvaluacidn de la 
psicopatologi'a con base en cl sistema MMPI. 
El orientador quc siguiera utilizando el MMPI 
original estarfa en posibilidad de quc se le de¬ 
mandant por negligencia, cn especial si sus in- 
terpretaciones para la prueba resultaran cn 
afirmaciones interpretativas enganosas o en un 
diagndstico falso. 

El terccr problema implied a alguien como 
traductor en la aplicacidn del WISC-III a un 
nido de nueve afios de edad cuyo primer idio- 
ma era cl espanol. En general, dste es un error, 
ya que sacrifica el control cstricto de los ma- 
terialcs de la prueba. El examinador no era bi- 
lingUe y, por tanto, no tern'a manera de saber si 
cl traductor era fiel al texto original o posible- 


mente estaba proporcionando indicios adicio- 
nales. En un mundo ideal, el procedimiento 
apropiado consistirfa en incorporar a un exa¬ 
minador hispanohablantc que utilizara una prue¬ 
ba traducida de manera formal y tambien 
estandarizada con personas de origen hispano. 
Porejemplo, la Escala de Inteligencia Wcchsler 
para Niftos-Revisada dc Puerto Rico (EIWN-R 
PR), que se analizd anteriormentc, serfa una 
buena opcidn. 

El ultimo dilema tenfa que ver con la clicn- 
le, que le informd a un psicdlogo quc su her- 
mano recientcmente muerto habfa sido, con toda 
probabilidad, un peddfilo. ^El psicdlogo estd 
obligado a informar de estc caso a las autori- 
dadcs competentes? Sf. pero ello podrfa de- 
pender de la jurisdiccidn del psicdlogo y del 
fraseo de los cstatutos pertinentes. De hccho, 
el psicdlogo sf informd del caso a las autorida- 
dcs, con inesperadas consecuencias. La poliefa 
obtuvo una orden de catco, fue al hogar de 
la madre de la clicntc (donde el hermano habfa 
vi vido) y registrd la habitacidn de dste. La ma¬ 
dre sc traumatizd a causa de la inesperada vi- 
sila de la poliefa y culpd del infortunio a su 
hija. A rafz de ello se dio una separacidn y la 
clientc demandd cntonces al psicdlogo por; vio- 
lacidn de la confidencialidad! 


RESUMEN 


1. Como ocurre con todas las actividades 
profesionales de los psicdlogos, la aplica¬ 
cidn de pruebas sc gufa por normas dticas 
y profesionales. El emplco responsable de 
pruebas se define por pautas cscritas y pu- 
blicadas por asociaciones profesionales 
como la American Psychological Association 
y otros grupos. 

2. Los editores de pruebas tambidn siguen 
pautas profesionales quc incluyen la expec- 
tativa dc quc venderdn pruebas de alta cali- 
dad. promoverdn sus productos dc manera 
responsable y restringirdn su distribucion 


sdlo a las personas con las credenciales 
apropiadas. 

3. Aunque existen cxcepciones, cn general la 
aplicacidn de pruebas se gufa por una pre¬ 
gunta suprema: ^cudlcs son los intereses del 
cliente? La implicacion funcional de esta 
pauta es que la evaluacidn deberfa satisfa- 
cer un propdsito constructive para la per¬ 
sona examinada. 

4. Los psicdlogos tienen la primordial obliga- 
cidn dc garantizar la confidencialidad dc la 
informacidn, incluyendo rcsultados de una 
prueba, que obtengan de sus clicntes cn el 
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curso de las consultas. Algunas excepcio- 
ncs incluyen circunstancias poco comunes 
cn las quc retener la informaciOn represen- 
taria un claro pcligro para el clientc o para 
otras personas. 

5. Los psicdlogos tiencn cl deber dc advertir 
que se deriva de la decision de 1976 para cl 
caso Tarasoff. Los clfnicos deben comuni- 
car cualquier amenaza grave, lanto a una 
vfctima potencial como a las autoridades 
competentes. 

6. La rcsponsabilidad ultima de la aplicacidn 
apropiada de las pruebas siempre reside en 
el usuario dc las mismas. Desde un punto 
de vista prdctico, esto significa que el usua¬ 
rio de pruebas debc tener el entrenamiento 
adccuado en evaluacidn y teorfa de la me- 
dicidn. 

7. La norma profesional accrca del consenti- 
miento informado dispone quc se debe in- 
formar a las personas examinadas acerca de 
las razones de la prueba, los tipos de prue¬ 
bas a utilizar, las posibles consecucncias dc 
la aplicacidn dc las mismas y de cudl infor¬ 
mation accrca de dstas se dard a conocer y 
a quic-n. 

8. El estandar de cuidado prevaleciente es el 
comun, acostumbrado y razonable. Satis- 
facer el estdndar de cuidado significa que 
el psicdlogo dcbc abstcncrse de utilizar 
pruebas anticuadas, en especial cuando esta 
disponible una nueva edition. 

9. Otras pautas para el emplco rcsponsable dc 
pruebas incluyen la redaction cuidadosa y 


eficaz del informe, asf como proporcionar 
a los individuos evaluados un reporte pru- 
dente y sensible de resultados que aclarc 
sus errores conceptuales. 

10. Otra cxpcctaiiva es quc la cvaluacidn sc 
guiard por el conocimicnto y respeto hacia 
las diferencias individuates. Por cjcmplo, 
los profesionales deben conocer los cfectos 
de la edad, gdnero, raza, origen dtnico y 
otras variables asociadas con antecedentes 
sobre los rcsultados de una prueba. 

11. Los factores culturalcs que pueden influir 
en los rcsultados de una prueba incluyen In 
manera cualitativa de enfocar una prueba, 
la confianza/desconfianza racial y la ame¬ 
naza del estereotipo. quc es la amenaza dc 
confirmar, como caractcristica propia. un es¬ 
tereotipo negativo acerca del propio grupo. 

12. Las barreras lingUfsticas tambien pueden 
inhibir el desempeiio en una prueba de 
los individuos dc minorfas. Las personas bi- 
lingUcs. y los individuos cuya lengua ma- 
tema no es el inglds, pueden enfrentar pro- 
blcmas sutilcs cn las pruebas desarrolladas 
para utilizarse en la cultura predominantc. 

13. Una falta de elaboration accrca de la na- 
turalcza dc las pruebas es otro factor que 
enfrentan algunos individuos dc minon'a. 
Las barreras del idioma y la falta de ela¬ 
boration hacia las pruebas son fuertes ar¬ 
guments a favor de utilizar un enfoque 
multidisciplinnrio para la cvaluaciOn 
(p. cj., cspccialistas cn psicologfa, habla y 
lectura). 


]§ TERMINOS Y CONCERTOS CLAVE 


ObligaciOn de advertir 
Consentimiento informado 


p. 691 
p. 693 


Estdndar dc cuidado 
Amenaza del estereotipo 


p. 693 
p. 699 






Principales hitos 
en la historia de las 
pruebas psicologicas 



2200 a.C. Los chinos comicnzan Ios priineros 
cx&mcncs para cl servicio publico. 

1838 Jean Esquirol distingue entre enfer- 
medad mental y retraso mental. 

1862 Wilhelm Wundt utiliza un pdndulo 
calibrado para medir la “velocidad 
del pensamiento". 

1866 O. Edouard Seguin escribe el pri¬ 
mer libro de texto importantc acer- 
ca de la evaluacidn y tratamiento del 
retraso mental. 

1869 Wundt funda el primer laboratorio 
de psicologi'a en Leipzig, Alemania. 


1884 Francis Gallon aplica la primera 
baterfa de pruebas a miles de ciu- 
dadanos en la Muestra Internacio- 
nal de Salud. 

1890 James McKeen Cattell utiliza el (6r- 
mino prueba mental cuando anun- 
cia sus planes para su baterfa galto- 
niana de pruebas. 

1896 Emil Kraepelin proporciona la pri¬ 
mera clasificacidn amplia de Ios 
trastomos mentales. 

1901 Clark Wisslerdescubre que los "ins- 
trumentos de bronce” de las prue- 
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bas cattellianas no (icnen correla- 
cion con las calificacioncs escolarcs. 

1904 

Charles Spearman propone quc la 
inteligcncia consiste de un s6lo fac¬ 
tor general, g, y numerosos facto- 
res especfficos, s { , s r s y etcetera. 

1904 

Karl Pearson formula la teorfa de la 
corrclacidn. 

1905 

Alfred Binet y Theodore Simon in- 
ventan la primera prueba modema 
de la inteligcncia. 

1908 

Henry H. Goddard traduce las es- 
calas Binct-Simon del francos al 
inglds. 

1912 

Stem introduce el Cl o cociente de 
inteligencia: la edad mental dividi- 
da entre la edad cronoldgica. 

1916 

Lewis Terman revisa las cscalas 
Binet-Simon, publica la Stanford- 
Binet; las revisiones de esta prueba 
aparecen en 1937, 1960 y 1986. 

1917 

Robert Yerkes encabezd el desarro- 
llode las pruebas Army Alfa y Beta 
utilizadas en los cxdmenes para los 
reclutas de la primera Guerra Mundial 

1917 

Robert Woodworth desarrolld la 
Hoja de datos personales, la prime¬ 
ra prueba de personalidad. 

1920 

Se publica la prueba de interprela- 
cidn de Formas de Rorschach. 

1921 

Cattell, Thorndike y Woodworth 
fundan la Psychological Corporation 
—primera editorial importante de 
pruebas. 

1926 

Florence Goodcnough publica la 
Prueba de la figura humana. 

1926 

La Junta de examen de ingreso a la 
universidad publica la primera 
Scholastic Aptitude Test (Prueba de 
Aptitudes Escolares). 

1927 

Se publica la primera edicidn del 
Strong Vocational Interest Blank 
(Formulario Strong de Intcreses Vo- 
cacionales). 


1935 

Morgan y Murray en la Universidad 
de Harvard publican el Test de aper- 
cepcidn tcmdtica. 

1936 

Lindquist y otros autores publican 
el precursor de las Iowa Tests of 
Basic Skills (Pruebas Iowa de Ha- 
bilidades B&sicas). 

1936 

Edward Doll publica la Vineland 
Social Maturity Scale (Escala 
Vineland de Madurcz Social) para 
la cvaluacidn de conducta adaptati- 
va en individuos con retraso mental. 

1938 

L. L. Thurslone propone que la inte¬ 
ligcncia consiste de aproximadamen- 
te siete factores de grupo conocidos 
como habilidadcs mentalcs primarias. 

1938 

Raven publica las Matrices progre- 
sivas de Raven, una prueba no ver¬ 
bal cuyo propdsito es medir el factor 
g de Spearman. 

1938 

Lauretta Bender publica el Test 
Gucstdltico Visomotor, una prueba 
de copiado de disefios acerca de la 
integracidn visomotora. 

1938 

Oscar Burns publica el primer Men¬ 
tal Measurements Yearbook. 

1938 

Arnold Gesell da a conocer su es¬ 
cala de desarrollo infantil. 

1939 

Se publica la Escala Wechsler- 
Bellevuc de Inteligencia; las revi¬ 
siones se publican en 1955 (WAIS), 
1981 (WAIS-R)y 1997 (WAIS-III). 

1939 

Publicacidn de las tablas Taylor- 
Russell para determinar la propor- 
cidn esperada de solicitantes exito- 
sos a travds de una prueba. 

1939 

Se publica el Registro de preferen- 
cias de Kuder, un inventario de in- 
tereses de opcidn forzosa. 

1942 

Se publica el Inventario Multifdsico 
de Personalidad de Minnesota 
(MMPI). 

1948 

La Office of Strategic Services (OSS) 
utiliza tdcnicas situacionales para la 
seleccidn de oficiales del ejdrcito. 



1949 

1950 

1951 

1952 

1953 

1954 

1956 

1957 

1958 

1959 

1963 

1967 
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Se publica la Escala Wechslcr de 
inteligcncia para nifios; aparecen re- 
visionesen 1974 (WISC-R) y 1991 
(WISC-UI). 

Aparcce el Rotter Incomplete 
Sentences Blank (Formulario de 
Oraciones incompletas de Rotter). 

Lee Cronbach introduce el coefi- 
ciente alfa como fndice de la confia- 
bilidad (consistencia interna) para 
pruebas y cscalas. 

La American Psychiatric Association 
publica el Manual Diagndstico y 
Estadi'stico (DSM I). 

Stephenson dcsarrolla la tdcnica Q 
para cstudiarcl autoconccpto y otras 
variables. 

Paul Meehl publica Clinical vs. 
Statistical Prediction 

Comienza a surgir la Halstead- 
Reitan Test Battery (Baterfa 
Halstead-Reitan) como la primera 
baterfa de pruebas cn neuropsico- 
logfa. 

C. E. Osgood describe cl diferen- 
cial scmdnlico. 

Lawrence Kohlberg publica la pri¬ 
mera versi6n de su Escala de juicio 
moral; la investigaci6n con ella sc 
expande hasta mediados del dcce- 
nio de 1980. 

Campbell y Fiske publican un en- 
foque de validacidn de pruebas que 
se conoce como matrix multirrasgo- 
multimltodo. 

Raymond Cattcll propone la teorfa 
de las inlcligcncias fluida y cristali- 
zada. 

En el caso de Hobson contra 
Hansen, el tribunal resuelve en con¬ 
tra del uso de las pruebas grupalcs 
de capacidad para “detectar" estu- 
diantes, con base en que dichas prue¬ 
bas discriminan en contra de ninos 
de minorfas. 


1968 

1969 

1969 

1971 

1971 

1971 

1972 

1974 

1974 

1975 

1978 


La American Psychiatric Association 
publica el DSM-II. 

Nancy Bayley publica las Bayley 
Scales ofIt font Development (BSID), 
(Escalas Bayley de Desarrollo In- 
fantil). En 1993 se publica la ver- 
si6n revisada (BSID-2). 

Arthur Jensen propone la hip6tcsis 
gendtica de las difercncias de Cl 
entre personas afroestadounidenses 
y de raza blanca en la Harvard 
Educational Review. 

En el caso de Griggs contra Duke 
Power, la Suprema Corte establece 
que los rcsultados de las pruebas 
para obtener un empleo deben te¬ 
ller una vinculacidn dcmostrable 
con el desempeho laboral. 

George Vaillant populariza una je- 
rarqufa de 18 mccanismos adapta- 
tivos del yo y describe una metodo- 
logfa para su cvaluacidn. 

Una dccisidn de la corte requiere 
que las pruebas utilizadas para se¬ 
lection de personal deben rclacio- 
narse con el puesto (Griggs contra 
Duke Power). 

Se publica la regia del Cddigo Pe¬ 
nal Modelo para la insanidad legal 
y se le adopta de mancra amplia en 
EUA. 

Rudolf Moos comienza la publica- 
ci6n de las Escalas de clirna social 
para cvaluar diferentes ambientes. 

Friedman y Rosenman popularizan 
el patrdn conductual Tipo A, con 
propensidn a la cardiopatfa; su eva- 
luacidn se basa en entrevistas. 

El Congreso de EUA aprueba la Ley 
publica 94-142, cl Dccrcto de edu- 
cacidn para todos los nifios con 
discapacidad. 

Jane Mercer publica el SOMPA 
(System of Multicultural Pluralistic 
Assessment-, Sistcma de evaluacidn 
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multicultural pluralista), una batc- 
rfa de pruebas disenada para redu- 
cir la discriminacidn cultural. 

1978 En las Uniform Guidelines on 
Employee Selection, el impacto ad- 
vcrso sc define a traves de la regia 
dc las cualro quintas partes; tambidn 
se publican los estudios sobre pau- 
tas para la seleccidn de personal. 

1979 En cl caso dc Larry P. contra 
Riles, el tribunal establece que las 
pruebas estandarizadas dc Cl mues- 
Iran sesgo cultural en contra de niiios 
de raza negra con funcionamiento 
inferior. 

1980 En el caso de Parents in Action on 
Special Education contra Hannon, 
el tribunal resuelve que las pruebas 
estandarizadas de Cl no cstdn ses- 
gadas a nivel racial o cultural. 

1985 La American Psychological Association 

y otros grupos publican dc manera 
conjunta los influyentes Standards 
for Educational and Psychological 
Testing. 


1985 

Sparrow y otros autores publican las 
Vineland Adaptive Behavior Scales 
(Escalas Vineland de Conducts 
Adaptativa), una revision de la 
Vineland Social Maturity Scale dc 
1936, una prueba Ifder en el drea. 

1987 

La American Psychiatric Association 
publica el DSM-III-R. 

1989 

Se seriala el "Efecto del Lago 
Wobegon”. Casi todos los estados 
de la EUA afirman que sus nivcles 
de rendimiento estdn por cncima del 
promedio. 

1989 

Se publica el Inventario multifdsico 
dc la personalidad de Minnesota-2 

1992 

La American Psychological Association 
publica una revisidn dc los Ethical 
Principles of Psychologist and 
Code of Conduct (American Psycho¬ 
logists, dicicmbre de 1992). 

1994 

La American Psychiatric Association 
publica el DSM-IV. 

1994 

Hermstein y Murray reviven el de¬ 
bate de la raza y la hereditabilidad 
del Cl en The Bell Curve. ■ 




Direcciones de 
editoriales 
de prueba 

—)iagl~iH~'IB—MBIIMIII'f MMUH 



American Association on Mental Retardation 
444 North Capitol Street, N. W. t Suite 846 
Washington, DC 20001-1512 


American College Testing Program 

P.O. Box 168 

Iowa City. IA 52243-0168 

American Guidance Service 
P.O. Box 99 

Circle Pines, MN 55014-1796 

C.P.S., Inc. 

P.O. Box 83 
Larchmont, NY 10538 


Consulting Psychologists Press 
P.O. Box 10096 
Palo Alto. CA 94303 

CTB/Macmillan/McGraw-Hill 
20 Ryan Ranch Road 
Monterey, CA 93940 

Denver Developmental Materials 
P.O. Box 20037 
Denver, CO 80220 

DLM Teaching Resources 
One DLM Park 
Allen. TX 75002 
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Educational and Industrial Testing 
Service (EdlTS) 

P.O. Box 7234 
San Diego, CA 92167 
Educational Testing Service 
ETS Test Collection (30-B) 

Rosedale Road 
Princeton. NJ 08541-001 

GED Testing Service 
One Dupont Circle, N. W. 

Washington. DC 20036 

Harvard University Press 
79 Garden Street 
Cambridge, MA 02138 

Hawthorne Educational Services 
800 Gray Oak Drive 
Columbia, MO 65201 

Marshal S. Hiskey 
5640 Baldwin 
Lincoln, NE 68507 

Hogrcfc & Huber Publishers 
P.O. Box 2487 
Kirkland. WA 98083 

Institute for Personality and Ability Testing 
P.O. Box 1188 
Champaign. IL 61824-1188 

Jastak Associates, Inc. 

P.O. Box 3410 

Wilmington, DE 19804-0250 

Jossey-Bass 

615 Montgomery Street 

San Francisco, CA 94111 

Mind Garden 
P.O. Box 60669 
Palo Alto. CA 94306 

National Computer Systems 
P.O. Box 1416 
Minneapolis, MN 55440 


Oxford University Press 
200 Madison Avenue 
New York, New York 10016 

Pro-Ed 

8700 Shoal Creek Boulevard 
Austin, TX 78757-6897 

Psychological Assessment Resources, Inc. 

P.O. Box 998 

Odessa. FL 33556-0998 

Psychological Corporation 

555 Academic Court 

San Antonio, TX 78204-2498 

Reitan Neuropsychology Laboratories 
2920 South 4th Avenue 
Tucson, AZ 85713-4819 

Riverside Publishing Company 
3 O’Hare Towers 
8420 Bryn Mawr Avenue 
Chicago, IL 60631 

Saul Rosenzweig 
8029 Washington Avenue 
St. Louis, MO 63114 

Scholastic Tecting Service 
480 Meyer Road 
P.O. Box 1056 
Bcnscnville, IL 60106-1617 

Sigma Assessment Systems, Inc. 

P.O. Box 610984 

Port Huron, MI 48061-0984 

SRA/London House 
9701 W. Higgins Road 
Rosemont, IL 60018 

Slosson Educational Publications, Inc. 

P.O. Box 280 

East Aurora, NY 14052 

Stocking Company 
620 Wheat Lane 
Wood Dale, IL 60191 


National Rehabilitation Services 
P.O. Box 1247 
Gaylord, Ml 49735 


Charles C. Thomas 
2600 South First Street 
Springfield, IL 62794-9265 
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U.S. Employment Service 
Western Assessment Research 
and Development Center 
140 East 300 South 
Salt Lake City, UT 841II 

U.S. Military Entrance 
Processing Command 
Testing Directorate 
2500 Green Bay Road 
North Chicago, IL 60064 

University of Illinois Press 
1325 South Oak Street 
Champaign, IL 61820 


Western Psychological Services 
12031 Wilshire Boulevard 
Los Angeles, CA 90025-1251 

West Virginia Rehabilitation Center 
509 Allen Hall 
West Virginia University 
Morgantown, WV 26506 

Wilmington Institute 
13315 Wilmington Drive 
Dallas. TX 75234 

Wonderlic Personnel Test, Inc. 

1509 North Milwaukee Avenue 
Libertyville, IL 60048-1380 ■ 





















Pruebas individuates de inteligencia 
y conducta adaptativa 

Adaptive Behavior Inventory for Children (In- 
ventario de conducta adaptativa para nifios); 
Psychological Corporation. 

AAMR Adaptive Behavior Scale (Escala dc con- 
ducta adaptativa AAMD); Pro-Ed. 

AAMR Adaptive Behavior Scale -School 
Edition (Escala dc conducta adaptativa AAMD 
-Edicidn escolar); Pro-Ed. 

Balthazar Scales of Adaptive Behavior (Esca- 
las dc conducta adaptativa Balthazar); Consul¬ 
ting Psychologists Press. 


Bayley Scales of Infant Development-11 (Es- 
calas dc dcsarrollo infanlil Bayley- II); 
Psychological Corporation. 

The Blind Learning Aptitude Test (Prucba de 
aptilud de aprendizaje para invidentes); 
University of Illinois Press. 

Bruininks-Oseretsky Test of Motor Proficiency 
(Prueba Bruininks-Oseretsky de destrcza mo- 
tora); American Guidance Service. 

Columbia Mental Maturity Scale (Escala Co¬ 
lumbia de madurez mental); Psychological 
Corporation. 

Denver-2\ Denver Developmental Materials. 
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Detroit Test of Learning Aptitude-3 (Pniebas 
Detroit de aptitud para el aprendizaje-3); Pro-Ed. 

Developmental Indicators for the Assessment 
of Learning-Revised (Indicadores del desarro- 
llo para la evaluation del aprcndizajc-rcvisada); 
American Guidance Service. 

Differential Ability Scales (Esc a I as de capaci- 
dad diferencial); Psychological Corporation. 

Test del dibujo de la figura humana: sistema de 
calificacidn cuantitativa; Psychological 
Corporation. 

Test de dibujo Goodenough-Harris; Psychological 
Corporation. 

Hiskey-Nebraska Test of Learning Aptitude 
(Prueba Hiskey-Nebraska de aptitud para el 
aprendizaje); Marshal S. Hiskey. 

Independent Living Behavior Checklist (Lista 
de veriftcaci6n conductual de vida independien- 
te); West Viiginia Rehabilitation Center. 

Baterfa de evaluacidn de Kaufman para niftos; 
American Guidance Service. 

Kaufman Brief Intelligence Test (Prueba breve 
de inteligencia de Kaufman); American 
Guidance Service. 

Kaufman Adolescent and Adult Intelligence Test 
(Prueba Kaufman dc inteligencia adolesccnte 
y adulta); American Guidance Service. 

Leiter International Performance Scale-Revised 
(Escala intemacional Leiter de desempeno-Re- 
visada); Stoelting Company. 

Escala McCarthy de aptitudes y psicomotricidad 
para ninos; Psychological Corporation. 

Miller Assessment for Preschoolers (Evaluation 
Miller para Preescolares); Psychological 
Corporation. 

Ordinal Scales of psychological Development 
(Escalas ordinalcs de desarrollo psicolOgico); 
Uzgiriz y Hunt (1989). 

Peabody Picture Vocabulary Test -Revised 
(Prueba Peabody de Vocabulario con Figura 
-Revisada); American Guidance Service. 


Scales of Independent Behavior-R (Escalas de 
conducta indepcndiente-R); DLM Teaching 
Resources. 

Stanford-Binct: Cuarta cdiciOn; Riverside 
Publishing Co. 

Test of Nonverbal Intelligence-3 (Prueba de 
inteligencia no verbal-3); Pro-Ed. 

TMR School Competency Scales (Escalas de 
compctencia escolar para DMT); Consulting 
Psychologists Press. 

Vineland Adaptive Behavior Scales (Escalas 
Vineland de conducta adaptativa); American 
Guidance Service. 

Escala Wechsler de inteligencia para adultos- 
III; Psychological Corporation. 

Escala Wechsler de inteligencia para ninos-III; 
Psychological Corporation. 

Escala Wechsler de inteligencia para los nivelcs 
precscolar y primaria-revisada; Psychological 
Corporation. 

Pruebas grupales de inteligencia 

Cognitive Abilities Test (Prueba de capacida- 
des cognitivas); Riverside Publishing Co. 

Culture Fair Intelligence Test (Prueba dc inte- 
ligcncia culiuralmente justa); Institute for 
Personality and Ability Testing. 

Henmon-Nelson Tests of Mental Ability (Prue¬ 
bas Henmon-Nelson de capacidad mental); 
Riverside Publishing Co. 

Kuhlmann-Anderson Tests of Mental Ability 
(Pruebas Kuhlmann-Anderson de capacidad 
mental); Scholastic Testing Service. 

Miller Analogies Test (Prueba Miller dc analo- 
gfas); Psychological Corporation. 

Multidimensional Aptitude Battery (Baterfa 
multidimensional de aptitud); Sigma 
Assessment Systems. 

Otis-Lennon School Ability Test (Prueba dc ca¬ 
pacidad escolar Otis-Lennon); Psychological 
Corporation. 
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Matrices progresivas dc Raven; Psychological 
Corporation. 

School and College Ability Tests -Series III 
(Pruebas de capacidad escolar y uni vcrsitaria 
-Serie III); Educational Testing Service. 

Shipley Institute of Living Scale (Escala del 
Shipley Institute of Living); Western 
Psychological Services. 

Wonderlic Personnel Evaluation (Prueba 
Wonderlic de personal); Wonderlic Personnel 
Test. 

Pruebas y baterias de aptitud 

American College Testing Assessment Program 
(Programa dc pruebas dc cvaluacidn universi- 
taria estadounidense); American College 
Testing Program. 

Armed Services Vocational Aptitude Battery 
(Baterfa de aptitudes vocacionales de las Fuer- 
zas Armadas); U. S. Military Entrance Proce¬ 
ssing Command. 

Test dc aptitudes difcrencialcs; Psychological 
Corporation. 

General Aptitude Test Battery (Baterfa de prue¬ 
ba de aptitud general); U. S. Employment 
Service. 

Graduate Record Examinations (Examencs de 
registro de posgrado); Educational Testing 
Services. 

Scholastic Assessment Test (Pruebas de cvalua- 
cion escolar); Educational Testing Service. 

Pruebas grupales de rendimiento 

California Achievement Tests (Pruebas de ren- 
dimiento dc California); CTB/Macmillan/ 
McGraw-Hill. 

Comprehensive Tests of Basic Skills (Pruebas 
amplias de habilidades basic as); CTB/Macmillan/ 
McGraw-Hill. 

Iowa Tests of Basic Skills (Pruebas Iowa de 
habilidades b£sicas); Riverside Publishing Co. 


Iowa Tests of Educational Development (Prue¬ 
bas Iowa de desarrollo educativo); Riverside 
Publishing Co. 

Metropolitan Achievement Tests (Pruebas de 
ejecucidn Metropolitan); Psychological 
Corporation. 

Sequential Tests of Educational Progress, Se¬ 
ries III (Pruebas secuenciales de progreso edu- 
cativo, Serie III); Educational Testing Service. 

SRA Achievement Series (Serie de rendimiento 
SRA); SRA/London House. 

Stanford Achievement Series (Serie Stanford dc 
rendimiento); SRA/London House. 

Stanford Test of Academic Skills (Prueba Stanford 
dc habilidades acaddmicas); Psychological 
Corporation. 

Test of Achievement and Proficiency (Pruebas 
de rendimiento y aprovechamiento); Riverside 
Publishing Co. 

Tests of General Educational Development 
(GED) (Prueba de desarrollo educativo gene¬ 
ral; GED); GED Testing Service. 

Pruebas individuales de rendimiento 

Kaufman Test of Educational Achievement 
(Prueba Kaufman de rendimiento educativo); 
American Guidance Service. 

Mini-Battery of Achievement (Minibaterfa de 
rendimiento); DLM Teaching Resources. 

Peabody Individual Achievement Test-Revised 
(Prueba Peabody de ejecucidn individual -revi- 
sada); American Guidance Service. 

Wechsler Individual Achievement Test (Prueba 
Wcchslcr dc rendimiento individual); Psycholo¬ 
gical Corporation. 

Wide Range Achievement Test-Ill (Prueba de 
rendimiento de amplio rango-III); Jastak 
Associates, Inc. 

Woodcock-Johnson Psycho-Educational Battery- 
Revised (Baterfa psicoeducativa Woodcock- 
Johnson-rcvisada); Riverside Publishing Co. 
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Pruebas psicomotoras y de destreza 

Crawford Small Parts Dexterity Test (Prueba 
dc destreza de partes pequenas de Crawford); 
Psychological Corporation. 

Hand-Tool Dexterity Test (Prueba de destreza 
mano-herramienta); Psychological Corporation. 

Test no verbal dc la Univcrsidad dc Purdue; 
SRA/London House. 

Stromberg Dexterity Test (Prueba Stromberg dc 
destreza); Psychological Corporation. 

Pruebas para trabajos de oficina 

Clerical Abilities Battery (Baterfa de capaci- 
dadcs para trabajos dc oficina); Psychological 
Corporation. 

General Clerical Test (Prueba general de tra¬ 
bajos dc oficina); Psychological Corporation. 

Minnesota Clerical Test (Prueba Minnesota dc 
trabajos dc oficina); Psychological Corporation. 

SRA Clerical Aptitudes (Aptitudes para traba¬ 
jos de oficina SRA); SRA/London House. 

Prueba de aptitudes mecanicas 

Bennett Mechanical Comprehension Test (Prue¬ 
ba Bennett dc comprensidn mecdnica); 
Psychological Corporation. 

Minnesota Spatial Relations Test (Prueba 
Minnesota dc relaciones espaciales); American 
Guidance Service. 

Revised Minnesota Paper Form Board Test 
(Prueba Minnesota revisada de tablero con for¬ 
mas de papel); Psychological Corporation. 

SRA Mechanical Aptitudes (Aptitudes mccdni- 
cas SRA); SRA/London House. 

Inventarios de intereses 

Campbell Interest and Skill Survey (Estudio de 
intereses y habilidades de Campbell); National 
Computer Systems. 


Jackson Vocational Interest Survey (Encucsta 
Jackson dc interns Vocacional); Sigma Assess¬ 
ment Systems. 

Kuder General Interest Sulvey (Estudio de intc- 
rcses gcncrales de Kuder); SRA/London House. 

Kuder Occupational Interest Survey (Estudio 
de intereses laborales) SRA/London House. 

Kuder Preference Record (Registro Kuder de 
preferencias); SRA/London House. 

Self-Directed Search (Busqucda autodirigida); 
Psychological Assessment Resources, Inc. 

Strong Interest Inventory (Invcntario Strong de 
intereses); Consulting Psychologists Press. 

Pruebas neuropsicologicas 

Test Guestdltico Visomotor, Western Psycholo¬ 
gical Services. 

Benton Revised Retention Test (Prueba Benton 
dc retencidn visual, revisada); Psychological 
Corporation. 

Finger Localization Test (Prueba de localiza- 
cidn de dedos); Oxford University Press. 

Halstead-Reitan Neuropsychological Test 
Battery (Baterfa dc pruebas ncuropsicoldgicas 
Halstead-Reitan); Reitan Neuropsychology 
Laboratories. 

Luria-Nebraska Neuropsychological Battery 
(Diagndstico Ncuropsicoldgico Luria-Ncbras- 
ka); Western Psychological Services. 

Test dc laberintos Porteus; Psychological 
Corporation. 

Serial Digit Learning Test (Prueba de aprendi- 
zaje de series de dfgitos); Oxford University 
Press. 

Symbol Digit Learning Test (Prueba dc modali- 
dadcs dc sfmbolos y dfgitos); Western Psycho¬ 
logical Services. 

Three-Dimensional Block Construction Test 
(Prueba dc construccidn con cubos tridimensio- 
nalcs); Oxford University Press. 
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Wechsler memory Scale-Revised (Escala Wschsler 
dc mcmoria-rcvisada); Psychological Corporation. 

Wisconsin Card Sorting Test (Prueba Wisconsin 
de clasificaci6n de tarjetas); Psychological 
Assessment Resources. 

Pruebas proyectivas de personalidad 

Test dc aperccpcidn infantil; C.P.S. Inc. 

Test del dibujo dc la figura humana; Charles C. 
Thomas. 

Holtzman Inkblot Test (Prueba Holtzman de 
manchas dc linta); Psychological Corporation 

Rorschach; Hogrefe & Huber Publishers 

Rosenzweig Picture-Frustration Study (P-F 
Study) (Estudio Rosenzweig de frustracidn por 
ilustraciones; Estudio P-F); Saul Rosenzweig. 

Rotter Incomplete Sentences Blank (Formula- 
rio dc oraciones incompictas dc Rotter); 
Psychological Corporation. 

Tdcnica dc apcrccpcidn para cdadcs avanza- 
das; C.P.S., Inc. 

Test de apercepcidn lernatica (TAT); Harvard 
University Press. 

Washington University Sentence Completion 
(Prueba dc frascs incompictas de la Universi- 
dad de Washington); Jossey-Bass. 

Inventarios de autoinforme de la 
personalidad 

Beck Depression In ventory (In ventario dc depre- 
si6n Beck, revisado); Psychological Corporation. 

Invenlario psicoldgico de California; Consul¬ 
ting Psychologists Press. 

Comrey Personality Scales (Escalas de perso¬ 
nalidad Comrey), EdlTS; Educational and In¬ 
dustrial Testing Service. 

Edwards Personal Preference Schedule (Inven- 
tario de preferencias personalcs de Edwards); 
Psychological Corporation. 


Eysenck Personality Questionnaire (Cuesliona- 
rio Eysenck de personalidad), EdlTS; Educatio¬ 
nal and Industrial Testing Service. 

Jenkins Activity Survey (Invcntario Jenkins de 
actividad); Psychological Corporation. 

Millon Clinical Multiaxial Inventory-3 (Inven- 
tario clfnico multiaxial dc Millon-3); National 
Computer Systems. 

Inventario multifSsico de la personalidad dc 
Minnesota-2; National Computer Systems. 

Inventario Tipoldgico dc Myers-Briggs; Con¬ 
sulting Psychologists Press. 

NEO Five Factor Inventory (Inventario NEO 
de cinco factores); Sigma Assessment Systems. 

NEO Personality Inventory-Revised (Inventa¬ 
rio NEO de personalidad); Sigma Assessment 
Systems. 

Personality Inventory for Children (Inventario 
dc personalidad para nifios); Western Psycholo¬ 
gical Services. 

Personality Research Form (Forma dc investi¬ 
gation de la personalidad); Sigma Assessment 
Systems. 

Cueslionario de 16 factores de la personalidad 
(16FP®); Institute for Personality and Ability 
Testing. 

Inventario dc ansiedad: rasgo-estado; Mind 
Garden. 

Survey of Work Styles (Estudio de estilos dc tra- 
bajo); Sigma Assessment Systems. 

Pruebas forenses 

Custody Quotient ™; Wilmington Institute. 

Parent-Child Relationship Inventory (Invenlario 
de rclacioncs padres-hijo); Western Psychological 
Services 

Rogers Criminal Responsibility Assessment 
Scales (Escalas Rogers dc cvaluacidn de la res- 
ponsabilidad criminal); Psychological Assess¬ 
ment Resources, Inc. ■ 
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Equivalentes de rangos 
percentiles en puntuacion 
estandar y estandarizada 
en una distribution normal 



Esla labia lista las equivalences emre 
rangos percentiles y otros cuatro tipos de pun- 
tuaciones: puntuaciones z (media de 0, DE de 
1.00); Cl de desviacidn (media de 100, DE 
de 15); puntuaciones T (media de 50, DE de 
10) y puntuaciones del tipo GRE (media de 500, 
DE de 100. La aplicacidn de la tabla supone 
que la distribucidn de calificaciones en una pruc- 
ba o variable es normal. 

Se ilustra con dos ejemplos la manera en 
que puede utilizarse este apendice. Supdngase 


que se tiene cl deseo de conoccr el Cl del WAIS-R 
que es equivalente a un rango percentil de 97. 
Si sc lee a lo largo de la fila que comienza con 
RP 97, sc descubririi que el Cl equivalente es 
de 128. Supdngasc que la inlcncidn es conocer 
cl rango percentil equivalente a una puntuacidn 
GRE de 675. En la columna al extremo dere- 
cho se localiza una calificacidn de 675 y se lee 
a lo largo de la fila hasta la columna al extremo 
izquierdo para descubrir que el rango percentil 
equivalente es 96. 
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z 

Cl de desviacion 

Puntuacion 

T 

Puntuacidn 
tipo GRE 

Media 

0.00 

100 

50 

500 

Des. est. 

1.00 

15 

10 

100 

RP 99 

2.33 

135 

73 

733 

98 

2.05 

131 

71 

705 

97 

1.88 

128 

69 

688 

96 

1.75 

126 

68 

675 

95 

1.64 

125 

66 

664 

94 

1.55 

123 

66 

655 

93 

1.48 

122 

65 

648 

92 

1.41 

121 

64 

641 

91 

1.34 

120 

63 

634 

90 

1.28 

119 

63 

628 

89 

1.22 

118 

62 

622 

88 

1.18 

118 

62 

618 

87 

1.13 

117 

61 

613 

86 

1.08 

116 

61 

608 

85 

1.04 

116 

60 

604 

84 

0.99 

115 

60 

599 

83 

0.95 

114 

60 

595 

82 

0.91 

114 

59 

591 

81 

0.88 

113 

59 

588 

80 

0.84 

113 

58 

584 

79 

0.80 

112 

58 

580 

78 

0.77 

112 

58 

577 

77 

0.74 

111 

57 

574 

76 

0.71 

111 

57 

571 

75 

0.67 

110 

57 

567 

74 

0.64 

110 

56 

564 

73 

0.61 

110 

56 

561 

72 

0.58 

109 

56 

558 

71 

0.55 

108 

56 

555 

70 

0.52 

108 

55 

552 

69 

0.49 

107 

55 

549 

68 

0.47 

107 

55 

547 

67 

0.44 

107 

54 

544 

66 

0.41 

106 

54 

541 

(contlnuidin) 






65 

64 

63 

62 

61 

60 

59 

58 

57 

56 

55 

54 

53 

52 

51 

50 

49 

48 

47 

46 

45 

44 

43 

42 

41 

40 

39 

38 

37 

36 

35 

34 

33 

32 

31 

30 
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z 

Cl de desviacion 

Puntuacidn 

T 

Puntuaclon 
tlpo GRE 

0.39 

106 

54 

539 

0.36 

105 

54 

536 

0.33 

105 

53 

533 

0.31 

105 

53 

531 

0.28 

104 

53 

528 

0.25 

104 

53 

525 

0.23 

104 

52 

523 

0.20 

103 

52 

520 

0.18 

103 

52 

518 

0.15 

102 

52 

515 

0.12 

102 

51 

512 

0.10 

102 

51 

510 

0.07 

101 

51 

507 

0.05 

101 

51 

505 

0.03 

100 

50 

503 

0.00 

100 

50 

500 

-0.03 

100 

50 

497 

-0.05 

99 

49 

495 

-0.07 

99 

49 

493 

-0.10 

98 

49 

490 

-0.12 

98 

49 

488 

-0.15 

98 

48 

485 

-0.18 

97 

48 

482 

-0.20 

97 

48 

480 

-0.23 

96 

48 

477 

-0.25 

96 

47 

475 

-0.28 

96 

47 

472 

-0.31 

95 

47 

469 

-0.33 

95 

47 

467 

-0.36 

95 

46 

464 

-0.39 

94 

46 

461 

-0.41 

94 

46 

459 

-0.44 

93 

46 

456 

-0.47 

93 

45 

453 

-0.49 

93 

45 

451 

-0.52 

92 

45 

448 


(contlmud6n| 
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z 

Cl de desviacion 

Puntuacidn 

T 

Puntuacidn 
tipo GRE 

29 

-0.55 

92 

44 

445 

28 

-0.58 

91 

44 

442 

27 

-0.61 

90 

44 

439 

26 

-0.64 

90 

44 

436 

25 

-0.67 

90 

43 

433 

24 

-0.71 

89 

43 

429 

23 

-0.74 

89 

43 

426 

22 

-0.77 

88 

42 

423 

21 

-0.80 

88 

42 

420 

20 

-0.84 

87 

42 

416 

19 

-0.88 

87 

41 

412 

18 

-0.91 

86 

41 

409 

17 

-0.95 

86 

40 

405 

16 

-0.99 

85 

40 

401 

15 

-1.04 

84 

40 

396 

14 

-1.08 

84 

39 

392 

13 

-1.13 

83 

39 

387 

12 

-1.18 

82 

38 

382 

11 

-1.22 

82 

38 

378 

10 

-1.28 

81 

37 

372 

9 

-1.34 

80 

37 

366 

8 

-1.41 

79 

36 

359 

7 

-1.48 

78 

35 

352 

6 

-1.55 

77 

34 

345 

5 

-1.64 

75 

34 

336 

4 

-1.75 

74 

32 

325 

3 

-1.88 

72 

31 

312 

2 

-2.05 

69 

29 

295 

1 

-2.33 

65 

27 

267 








Acomodacion. En la teorfa dc Piaget, la adap- 
tacidn de un esqucma que no ha tenido 6xi- 
to, a fin de que funcione, 

Afasia. Cualquier dcsviacidn en cl desemperto 
en cl lenguaje, producida por dafio cerebral. 

Agnosia visual. Dificultad en el reconocimicn- 
to de dibujos, objetos o rostros producida 
por dafio cerebral. 

Alegato de demcncia. En casos judiciales, de- 
fensa basada en la referenda a la demen- 
cia legal como la determinan el Cddigo 
Penal Modelo u otros estatutos lcgales. 


Amcnaza del estereotipo. La amenaza dc con- 
firmar, como caracterfstica propia, un es¬ 
tereotipo negativo acerca del propio grupo. 

AnAlisis de puestos. Proceso para definir un 
pucsto en tdrminos de las conductas ncce- 
sarias para desempcfiarlo; incluye descrip- 
cidn del puesto (caracterfsticas ffsicas del 
mismo) y especificacidn del mismo (carac¬ 
terfsticas personales necesarias). 

Analisis factorial. Familia de procedimientos 
estadfsticos que utilizan los investigadores 
para resumir las relaciones entre variables 
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que se corrclacionan de modos sumamen- 
te complejos; la mcta del anOlisis factorial 
consistc cn derivar un conjunto parsimo- 
nioso de factores derivados. 

Ansiedad de prueba. Una constelaciOn de res- 
pucstas fcnomcnolOgicas, fisioldgicas y 
conductualcs que acompanan la preocu- 
pacion acerca del posible fracaso en una 
prueba. 

Ansiedad estado. Senlimientos transitorios de 
temor o prcocupacidn que experimentan la 
mayoria de las personas en ciertas ocasiones. 

Ansiedad rasgo. Tendencia rclalivamcnlc es- 
table de un individuo a responder de ma- 
nera ansiosa a situaciones estresantes. 

Apraxia. Variedad de trastomos caractcrizados 
por una falla en la direcciOn o ejecuciOn de 
actos motores complejos. 

AsignaciOn. En cvaluaciOn con pruebas, la dis- 
tribuciOn de las personas cn diferentes pro- 
gramas apropiados para sus necesidadcs o 
habilidadcs. 

AsimiiaciOn. En la teorfa de Piaget, la aplica- 
ciOn de un esquema a un objeto, persona o 
acontecimiento. 

Autista sabio. Individuo con retraso mental que 
tiene un talento sumamente desarrollado cn 
una sola Area, como arte, cOlculo rdpido, 
memoria o musica. 

Autocficacia. En la teorfa de Bandura, juicio 
personal acerca de qud tan bicn puede uno 
cjccutar los cursos de acciOn requeridos 
para manejar situaciones futuras. 

Automonitoreo. Enfoque terapOutico en el que 
el cliente elige las melas y participa de ma- 
nera activa en la supervision, graficaciOn y 
registro del progreso hacia los Ones de la 
tcrapia. 

Ayuda. En exdmenes psicoldgicos, intento por 
mejorar las calificaciones de una prueba al 
proporcionarle al individuo evaluado priSc- 
tica adicional en materiales similares, re¬ 
vision de conccptos fundamentales que es 
probable que se cubran cn la prueba y con- 


sejo acerca dc las estrategias dptimas para 
la presentacidn de la misma. 

Carga factorial. En el andlisis factorial, la co- 
rrelacidn entre una prueba individual y un 
solo factor. 

Centro de evaluacidn. Enfoque para cvaluar 
el talento gerencial que consiste cn multi¬ 
ples tecnicas de simulacidn, incluyendo 
presentacioncs de grupo, ejercicios de so- 
lucidn dc problcmas, ejercicios de discu- 
sidn grupal, entrevistas y tOcnicas de 
bandeja de entrada. 

Cercbelo. Parte del metencdfalo responsable 
dc ayudar a coordinar tono muscular, pos¬ 
ture y movimientos hdbilcs. 

Ccrtificacidn. Examen para determinar que una 
persona tiene cuando menos un mfnimo de 
destreza cn alguna disciplina o actividad. 

ClasificaciOn de expertos. Un metodo de es- 
cala que depende de los juicios de exper¬ 
tos para determinar las clasificaciones de 
los componcntcs individuates. 

ClasificaciOn. En exOmencs psicoldgicos, el 
proceso dc utilizar pruebas para asignar a 
una persona dentro de una catcgorfa mOs 
que de otra. 

Coeficiente alfa. fndice de confiabilidad que 
puede considerarse como la media de to- 
dos los cocficientes posibles por mitadcs, 
corregido segun la fOrmula de Spearman- 
Brown. 

Coeficiente de confiabilidad. ProporciOn de 
varianza verdadera dc la puntuaciOn con 
rcspecto a la varianza total dc las califica¬ 
ciones dc la prueba. 

Coeficiente de correlaciOn. Indice numOrico 
del grado de relaciOn lineal entre dos con- 
juntos de calificaciones; los cocficientes de 
correlaciOn pueden variar entre -1.00 y 
+1.00. 

Coeficiente de personalidad. TOrmino utili- 
zado para referirse al dcscubrimicnto dc 
que la validez predictiva de las escalas 
de personalidad supera en pocas ocasiones 
al .30. 
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Coeficiente de validez. Correlacidn cntre la 
prueba y el criterio (r jy ). 

Competencia para somcterse a juicio. De- 
terminacidn del juez quc preside la sala accr- 
ca de que un acusado no tienc dcfecto, 
enfermedad o padccimiento mental quc le 
incapacite para comprender el proceso o 
para ayudar cn su defensa. 

Comprension verbal. Primer factor en el 
W1SC-II1 que incluye Informacidn, Seme- 
janzas, Vocabulario y Comprensidn. 

Conducta no verbal. Formas sutiles de cornu- 
nicacidn humana contenidas en la mirada, 
ademanes, lenguaje corporal, tono de voz 
y expresidn verbal. 

Confiabilidad de formas altcrnas. Metodo de 
confiabilidad en el quc se aplican formas 
altemas de una misma prueba a un grupo 
de individuos heterogdneos y representati¬ 
ves; despuds se correlacionan las califica- 
ciones de cada forma. 

Confiabilidad intercalificadores. Para prue- 
bas que implican calificacidn segun un jui¬ 
cio, grado cornu n de concordancia entre 
calificadores. 

Confiabilidad por mitades. Forma de 
confiabilidad en la que las calificaciones 
de ambas mitades de una prueba se corre¬ 
lacionan entre sf (p. ej., rcactivos pares con¬ 
tra nones); la correlacidn sc ajusta entonces 
en cuanto a la extensidn de la prueba. 

Confiabilidad test-retest. Forma de confia¬ 
bilidad cn la que sc aplica la misma prueba 
dos veces al mismo grupo de individuos 
heterogdneos y representativos; despuds se 
correlacionan las calificaciones de ambas 
sesiones. 

Confiabilidad. Atributo de consistencia en la 
medicidn. 

Conmocion cerebral. Altcracidn transitoria de 
la conciencia debida a un golpe en la cabe- 
za; puede ir seguida por amnesia temporal, 
mareo, nauseas, pulso ddbil y respiracidn 
lenta; sin embargo, no existc dafio cerebral 
orgdnico demostrable. 


Consentimiento informado. En pruebas, el 
principio de informar a la persona cvalua- 
da o a sus representantes, en un lenguaje 
que puedan comprender, los propdsitos de 
las pruebas y sus posibles consecuencias. 

Conservaddn. En la tcorfa de Piaget, conciencia 
de que las cantidades ffsicas no cambian 
cuando se les altera superficialmente. 

Constancia del Cl. En las pniebas Wechsler, 
suposicidn axiomdtica de que el Cl debe 
permanecer constante a medida que se en- 
vejece normalmente, aun cuando la capa- 
cidad intclectual bruta pueda cambiar o 
declinar. 

Constructo. Cualidad o rasgo tedrico e intan¬ 
gible en el cual difieren los individuos. 

Contaminacidn del criterio. Fuente de error 
en la validacidn de una prueba cuando el 
criterio se “contamina” debido a su semc- 
janza artificial con la misma, de modo que 
la prueba y el criterio contienen rcactivos 
casi iddnticos. Tambidn es una forma 
de valorar el error en cl cual una medida de 
criterio incluye factores que no son parte 
demostrable del trabajo, porejemplo, la apa- 
rente clasificacidn cuando dstc no es tra¬ 
bajo- relacionado. 

Correccidn de conjeturas. En las pruebas 
grupalcs, la prdctica de revisar la califica- 
ci6n final del individuo cuando existe apa- 
rente conjeturacidn. 

Corteza cerebral. Capa externa del cercbro, quc 
es la fuente de los ni veles superiores de pro- 
cesamiento sensorial, motor y cognitivo. 

Cuadro de cxpectativas. Un cuadro que re- 
presenta la relacidn establecida entre las ca¬ 
lificaciones de una prueba y los resultados 
esperados cn una relacionada. 

Cuerpo calloso. La principal comisura que sir- 
ve para integrar las funciones de ambos he- 
misferios cerebrales. 

Culpable pero mentalmente enfermo. Vere¬ 
dicto permitido cn algunos estados en el 
que la intencidn es que el acusado comien- 
ce su condcna cn un hospital psiquidtrico. 
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Cuotas. En pruebas de seleccidn, la postura 
dtica de que los candidatos mds califica- 
dos dcnlro dc subgrupos definiblcs dcbcn 
seleccionarse en proporcidn a su represen- 
tacidn dentro de la poblacidn. 

Curva reactivo-caracterfstica. Representa- 
ci<5n grdfica de la relacidn cntre la proba- 
bilidad de una respuesta correcta y la 
posicidn de la persona evaluada en el ras- 
go subyacente medido por la prueba. 

Danos pcrsonales. En las demandas por dafios 
personates, los abogados pueden conlratar 
a psicblogos para que (estifiqucn con rela- 
cidn a las consecuencias crdnicas del estrds 
traumdtico o del dano cerebral adquirido. 

Datos biograficos. Datos autobiogrdficos ob- 
jetivos o calificables: reconocidos como 
complemento vdlido para la sclcccidn de 
personal. 

Deber de advertir. Derivado del caso Tarasoff, 
se refiere a la responsabilidad del clfnico de 
comunicarcualquier amcnaza grave a la vfc- 
tima potencial, organismos encargados de 
velar por el cumplimiento de la ley o ambos. 

Dccreto sobre los estadounidenses con 
dlscapacidadcs. Ley aprobada por el Con- 
greso dc EUA en 1990 que prohfbe la dis- 
criminacidn contra individuos califlcados 
que tienen discapacidades. 

Definit ion funcionalista de validez. Perspec- 
tiva dc que una prueba es vdlida si sirve 
para el propdsito para el que se le utiliza. 

Definition operacional. Definicidn dc un con- 
cepto en tdrminos de la manera en que se 
mide; como inteligencia es “!o que miden 
las pruebas”. 

Definition real. Una definition que intenta de- 
cimos la verdadcra naturaleza dc las cosas 
que sc definen. 

Desviacion cstandar. Indice estadfstico que 
refleja el grado de dispersion en un grupo 
dc calificaciones; la rafz cuadrada de la 
varianza. 

Detection. Uso de pruebas o proccdimientos 
rdpidos y simples para identificar a las per¬ 


sonas que podrian tener caracteristicas o 
necesidades especiales. 

Diagndstico. Determinacidn dc la naturaleza y 
fuente dc la conducta anormal de una per¬ 
sona y clasificacidn del patrdn conductual 
dentro de un sistema diagndstico aceptado. 

Difcrencial semant ico. Tdcnica dc calificacidn 
en la que el individuo utiliza un continuo 
de siete puntos para calificar un concepto 
o varios adjetivos bipolares como bueno- 
malo, fuerte, d6bil, activo-pasivo. 

Dilema moral. Historia breve que implica una 
eleccidn moral dificil, como robar para pro- 
longar la vida de otra persona; se lc utiliza 
en el estudio del razonamiento moral. 

Discapacidad para el aprendizaje. Concepto 
indistinto que por lo comun se refiere a una 
discrepancy grave entre la capacidad ge¬ 
neral y el rendimiento individual que no 
puedc explicarse por discapacidad senso- 
rial/motora, retraso mental, problemas emo- 
cionalcs o privacidn cultural. 

Diseiio longitudinal. Diseno de invcstigacidn 
en el que se examina a los mismos indivi¬ 
duos en di versos puntos en cl tiempo. 

Diseno transecuencial. Diseno de investiga- 
ci6n que combina los mdtodos transversal 
y longitudinal. 

Diseno transversal. Diseiio dc investigacidn 
en el que se examina a individuos dc dife- 
rentes edades en algun punto en el tiempo. 

Dispraxia de construccion. Altcracion de la 
capacidad para manejar relaciones espacia- 
les en un esquema, ya sea de 2 o 3 dimen- 
siones. 

Distrihucion de frecuencias. Mdtodo para re- 
sumir los datos o calificaciones de una 
prueba al cspecificar un pequeno numero 
de intervalos de clase que por lo general 
son de igual tamano y despuds registrar 
cudntas calificaciones caen dentro de cada 
intervalo. 

Distribution normal. Dislribucidn simdtrica 
de frecuencias, definida en tdrminos mate- 
mdticos y en forma de campana. 
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Ecoaomia dc fichas. Enfoque conductual en cl 
que se recompensan muchas difcrentes for¬ 
mas dc conducts prosocial a travds de fichas 
que puedcn intercambiarse dcspuds por re- 
compcnsas matcrialcs o por privilcgios. 

Ecuacion de regresidn. Ecuacidn que descri¬ 
be la Ifnea recta que mis sc ajusta para es- 
timar cl criterio a partirde la prueba; la lfnea 
que mis se ajusta es aquella que reduce al 
mfnimo las desviaciones al cuadrado con 
respecto a la misma. 

Efecto alcohdllco fetal. Version leve del sfn- 
drome alcohdlico fetal en cl que no se ob- 
servan anormalidades ffsicas, pero se notan 
problemas conductuales como dificultades 
en atcncidn. 

Efccto dc halo. Tendencia a calificar a un cm- 
pleado como alto o bajo en todas las di- 
mensiones debido a una impresidn global. 

Efccto del Lago Wobegon. Observacidn dc 
que casi todos los cstados de EUA afir- 
man que las calificacioncs promedio de ren- 
dimiento para sus sistemas escolares 
superan al percentil 50. 

Ejercicio situadonal. Procedimiento dc eva- 
luacidn en el que se pide al futuro empleado 
que desempefie el trabajo bajo circuns- 
tancias que son sumamente similares al 
ambiente laboral anticipado. 

Ejes oblicuos. En andlisis factorial, la suposicidn 
de que los factores se correlacionan entre 
sf; es deeir, no cstin en Angulos rectos. 

Ejes ortogonalcs. En andlisis factorial, la supo¬ 
sicidn de que los factores estdn en Angulo 
recto entre sf, lo cual significa que perma- 
necen intercorrelacionados. 

Elio. En la tcorfa psicoanalftica, parte incons- 
ciente de la personalidad donde residen 
todas las nccesidades instintivas, como 
aqudllas de comida, agua, gratificacidn 
sexual y evitacidn del dolor. 

Enfermcdad dc Alzheimer. Trastomo neuro- 
Idgico degenerativo; en las primeras eta- 
pas el sfntoma mis notable es la pdrdida de 
memoria. 


Enfoque adaptado al criterio. Enfoque de de- 
sarrollo de pruebas en el que los reactivos 
se asignan a una escala particular si, y sdlo 
si, discriminan entre un grupo criterio bicn 
definido y un control relacionado. 

Equidad de una prueba. El grado al cual las 
consecuencias sociales del uso de pruebas 
se consideran justas para subgrupos rcla- 
cionados; la equidad dc una prueba es una 
cucstidn dc valores sociales y es pertinente 
en especial cuando las pruebas se utilizan 
para tomar decisiones de selecci6n. 

Equilibration. En la teorfa dc Piaget, proceso 
completo de asimilacidn, acomodacidn y 
cquilibrio. 

Error administrative dc calificacidn. En exi- 
menes psicoldgicos, un error en la califi¬ 
cacidn de una prueba relacionado con la 
mecAnica de calificacidn; como sumar de 
manera incorrecta las calificaciones o con¬ 
sular la tabla de conversidn errdnea. 

Error de medicidn. Toda otra calificacidn di- 
ferente a la verdadera que integra la califi¬ 
cacidn total obtenida por la persona 
evaluada. 

Error estindar de cstirnacion. SE ni es el margen 
dc error que puede esperarse en la puntua- 
cidn de criterio predicha; el error de csti- 
macidn se obtiene de la siguiente fdrmula: 

SE = SDVl - r 2 
cmI y xx 

Error cstdndar de la difercncia. fndice esta- 
dfstico que puede ayudar al usuario de una 
prueba a determinar si, en el caso de un 
individuo examinado, la diferencia entre las 
calificaciones de dos pruebas o subpruebas 
es significativa. 

Error estindar de medicidn. fndice del error 
de medicidn que indica el grado al que las 
calificaciones de una persona examinada 
podrfan variar en varias pruebas paralelas. 

Error sistemitico de medicidn. Tipo dc error 
de medicidn que surge cuando, sin que lo 
sepa quien dcsarroll6 la prueba, el instru- 
mento midc alguna otra cosa diferente al 
rasgo al cual se dirige. 
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Escala C. Variantc de la escala de estaninas con 
11 unidadcs. 

Escala de clasificacidn con base conduc- 
tual. Escala de clasificacidn rcfcrida a 
critcrio. 

Escala de clcccion forzosa. Escala de cvalua- 
ci6n del dcsempeno disenada para climi- 
nar el sesgo y subjetividad en las 
calificaciones del supervisor al forzar una 
cleccidn entre opciones iguales en cuanto 
a deseabilidad social. 

Escala de estdndar inixto. Enfoque complcjo 
para la valoracidn del desempefio disena- 
do para reducir al mlnimo los errores de 
calificacidn en la evaluacidn del desempc- 
no; los reactivos para las dimensiones de 
dcsempeno se ordenan de mancra alcatoria 
en la escala. 

Escala de estaninas. Una escala en la que to- 
das las puntuaciones naturalcs sc convicr- 
ten a un sistema de calificaciones dc un solo 
dfgito que va de 1 a 9. 

Escala de estenes. Escala de 10 unidadcs con 
cinco unidades por encima y cinco unida¬ 
dcs por dcbajo dc la media. 

Escala de intcrvalo. Escala de medicidn que 
proporciona informacidn acerca de la cla¬ 
sificacidn por rangos y fortaleza relativa de 
los mismos; basada en la suposicidn de uni¬ 
dadcs o intervalos de igual tamano para la 
escala subyacente. 

Escala de observacidn conductual. Una va- 
riacidn sobre la tdcnica BARS, que utiliza 
un continuo desde “casi nunca” hasta “casi 
sicmpre” para mcdir la frecuencia con la 
que un empleado lleva a cabo (areas espe- 
cfficas en cada dimension conductual. 

Escala grdfica dc calificacidn. Escala que in- 
cluyc ctiquetas de rasgo, definiciones bre¬ 
ves de dichas etiquetas y un continuo para 
calificacidn. 

Escala homogenea. Escala en la que los 
reactivos individuales tienden a medir la 
misma cosa; la homogencidad se estima a 
travds de corrclaciones reactivo-total. 


Escala Likert. Escala que le presents a la per¬ 
sona examinada cinco rcspucstas ordena- 
das en un continuo de acuerdo/desacuerdo 
o aprobacidn/desaprobacidn. 

Escala nominal. Escala de medicidn en la que 
las categories son arbitrarias y no desig. 
nan “mis” o "menos" dc ninguna cosa; el 
nivel mds sencillo y bajo de medicidn. 

Escala ordinal. Escala de medicidn que per- 
mite una clasificacidn; las escalas ordinalcs 
no proporcionan informacidn acerca de la 
fortaleza relativa de la clasificacidn. 

Escala radio. Escala de medida que produce 
unidades o intervalos de igual tamario y po- 
see un punto cero conccptualmcnte signi- 
ficativo; cl nivel mds alto dc medida. 

Esquema. En la teoria dc Piaget, patron orga- 
nizado dc conducts o cslructura mental bien 
definida que conduce al conocimiento de 
edmo haccr alguna cosa. 

Estado mental al momento de la ofensa 

(EMO). El estado mental dc un acusado al 
momento dc cometcr la ofensa es pertinente 
en defensas especiales como la defensa de 
insania; los psicdlogos y psiquiatras pue- 
den ofrecer opiniones acerca del EMO dc 
un acusado. 

Estdndar de cuidado. Las normas de cuidado 
que son comunes, acostumbradas o razo- 
nables. 

Evaluacidn conductual. Varicdad de tdcnicas 
que se conccntran en la conducts en sf, 
mds que en los rasgos subyacentes, cau- 
sas hipoteticas o supucstas dimensiones de 
personalidad. 

Evaluacidn psicoldgica asistida por compu- 
tadora, CAPA. Se refiere al rango com- 
pleto de aplicaciones computacionales en 
la cvaluacidn psicoldgica e incluye aplica- 
cidn, calificacidn, redaccion del informc y 
aplicacidn individualizada de la prueba. 

Evaluacion. Valoracidn o estimacidn del nivel 
o magnitud de algun atributo de una perso¬ 
na; las pruebas son sdlo una pcqueria parte 
de la evaluacidn, que tambidn incluye ob- 
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servaciones, cntrevistas, cscalas dc califi- 
cacidn y listas de verification. 

Expresidn religiosa extrfnseca. Uso de la re- 
ligidn para metas extemas como scguridad, 
estatus y amistad. 

Expresidn religiosa intrinseca. Utilizacidn de 
la religi6n para metas intemas como en- 
contrar significado y direccidn en la vida. 

Extraversion. Disposicidn de personalidad so¬ 
ciable, comunicativa y de busqueda de 
emociones. 

Factor especffico. Scgun Spearman, un factor 
de la inteligencia especffico dc una prueba 
individual. 

Factor general. Scgun Spearman, el factor ge¬ 
neral dc inteligencia que debc existir para 
explicar las corrclaciones observadas cn- 
tre un gran numero de pruebas. 

Factor. Constructo o variable subyacentc que 
ayuda a explicar las corrclaciones entre va- 
rias pruebas o medidas. 

Falacia de la cstandarizacion. Perspcctiva cn- 
ganosa de que una prueba estandarizada en 
una poblacibn es injusta ipso facto cuando 
sc lc utiliza con cualquier otra poblacidn. 

Falso negativo. En la teorfa de decisidn, un in- 
di viduo dc quien sc ha pronosticado de ma- 
nera incorrecta que fracasard en cl criterio. 

Falso positivo. En la teorfa de decision, un in- 
dividuo dc quien se ha pronosticado de ma- 
nera incorrecta que tendril dxito en el 
criterio. 

Formacion reticular. Red de cuerpos y fibras 
neuronalcs asccndcntes y descendentes que 
gobieman la excitacidn general o la con- 
ciencia. 

Formula Kudcr-Richardson 20. fndice de la 
confiabilidad que es pertinente para el caso 
especial donde cada reactivo dc una prue¬ 
ba se califica con 0 o 1 (p. cj., corrccto o 
incorrecto). 

Formula Spearman-Brown. Formula para 
ajustar las correlaciones por mitadcs, dc 
modo que rcflejen la extensidn total de una 
escala. 


Frustration. En el sistema de Rosenzweig, cs- 
tado que ocurre cuando un organismo se 
enfrenta a un obstiiculo u obstruccidn en la 
busqueda dc satisfacer una nccesidad. 

Funciones cjccutivas. Funciones cerebrales 
que incluycn analisis Idgico, formacion dc 
conceptos, razonamiento, planificacidn y 
flexibilidad dc pensamiento. 

Ganglios basales. Conjunto dc mlcleos del 
proscncdfalo que se concctan con la corte- 
za cerebral en la parte superior y cl tdlamo 
en la parte inferior, los ganglios basales par- 
ticipan en el control del movimiento. 

Gliindula pineal. Estructura del tamaho de un 
guisantc que se encucntra en cl centre del 
cerebro; secreta la hormona mclatonina en 
un ritmo bioldgico cfclico, pero sus fun- 
cioncs no se han comprendido del todo. 

Grupo normativo. Muestra dc personas eva- 
luadas que son representativas de la pobla- 
ci6n hacia la cual sc dirige la prueba. 

Habilidadcs mcntales primarias. Siete fado¬ 
res grupalcs dc la inteligencia propuestos 
por Thurstonc. 

Hipocampo. Parte dc un circuito de memoria 
complejo, indeflnido que consolida las 
experiencias nuevas en recucrdos a largo 
plazo. 

Hipotalamo. Pequena estructura al centre del 
cerebro que ayuda a gobernar la conducta 
motivada y la regulacidn corporal: ahmen- 
tacidn, conducta sexual, sueho, regulacidn 
de temperatura, conducta emocional y mo¬ 
vimiento. 

Hipdtesis lexica fundamental. En la teorfa de 
la personalidad, concepto dc que los tdr- 
minos para rasgo han sobrevi vido en el len- 
guaje debido a que trasmiten informacidn 
import ante sobre nucstros tratos con otras 
personas. 

Ilipdtesis proycctiva. Suposicion de que las 
interpretaciones personales de los estfmu- 
los ambiguos deben necesariamente refle- 
jar las necesidades, motivos y conflictos 
inconscientes de la persona examinada. 
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Histograma. Mdtodo para resumir datos o ca- 
lificaciones dc una prueba en forma grdfi- 
ca; dste contienc la misma informacidn quc 
una distribucidn de frecuencias. 

Impaclo ad verso. En la contratacidn dc per¬ 
sonal, se dice que existe un impaclo ad ver¬ 
so si un grupo tienc una tasa dc scleccidn 
menor a cuatro quintas partes de la tasa del 
grupo con el nivel de seleccidn mds alto 
(Uniform Guidelines on Employee 
Selection, 1978). 

fndice de confiabilidad del reactivo. .rr r el 
producto de la consistcncia interna de un 
reactivo de una prueba como se indexa por 
la correlaci6n con la calificacidn total (r IT ) 
y su variabilidad como se indexa por la des- 
viacidn estdndar (s). 

indice de deterioro intelectual. En la Escala 
del Shipley Institute of Living, fndice basa- 
do en la discrepancia entre la capacidad ver¬ 
bal y de abstracciones que tiene el prop6sito 
de estimar los efectos de la discapacidad 
cerebral orgdnica. 

jndice de dificultad del reactivo. Para un solo 
reactivo dc una prueba, proporcidn de in- 
dividuos examinados en una gran muestra 
del pilotco que responden correctamente 
cse reactivo. 

indice de discriminacion del reactivo. Indice 
estadfstico de la cficacia con la que un 
reactivo discrimina entre personas que ob- 
tienen calificacioncs altas y bajas en la 
prueba completa. 

indice de hereditabilidad. Eslimado de aque- 
11a parte de la varianza total en un rasgo 
dado que se debe a factores gendticos; el 
fndice puede variar desde 0.0 a 1.0 

indice de la validez del reactivo. sr^ , conso¬ 
le del producto de la desviacidn estdndar 
de un reactivo de prueba (s,) y la correla- 
cidn punto-biserial con el criterio, r^. 

Individualismo calificado. En pruebas de sc- 
leccidn, la postura dtica de que no deben 
utilizarse la edad, sexo, raza y otras carac- 
terfsticas demogrdficas, incluso si cl cono- 


cimiento de dichos factores pudicra mejo- 
rar la validez dc la seleccidn. 

Individualismo no calificado. En pruebas dc 
seleccidn, postura dtica en la que, sin ex- 
cepcidn, debe seleccionarse para cl pues- 
to, admisiones u otros privilegios a los 
candidatos mejor calificados. 

Intcligencia componencial. En la teorfa de 
Sternberg, mecanismos mentales internos 
responsables de la conducta inteligente. 

Intcligencia contextual. En la teorfa de 
Sternberg, actividad mental implicada en 
la adaptacidn propositiva, moldeamiento y 
seleccidn de ambientes reales pertinentes 
a la propia vida. 

Intcligencia cristalizada. En la teorfa de Cattcll 
y Horn, aquello que ya se ha aprendido por 
la inversidn de la inteligencia fluida en am¬ 
bientes culturales (p. ej. aprender Algebra 
en la escuela). 

Intcligencia expcriencial. En la teorfa de 
Sternberg, capacidad para enfrentarse 
de mancra eficaz con tareas novedosas. 

Inteligencia fluida. En la teorfa de Cattell y 
Horn, una forma de eficiencia mental prin- 
cipalmente no verbal y que tiene una in¬ 
fluence cultural relativamente reducida. 

Inteligencia social. Capacidad para compren- 
der a otras personas y relacionarse de ma- 
nera eficaz con ellas. 

Inteligencia. Scgun los expertos, 1) la capacidad 
para aprender de la experience y 2) la capa¬ 
cidad para adaptarse al propio ambiente. 

Interpretacion de una prueba basada en sis- 
temas, CBT1. Se refiere a la interprctacidn 
de una prueba y redaction del informe he- 
chos por sistemas, que es uno de los prin¬ 
cipals componentes de la evaluacidn 
psicoldgica asistida por computadora 
(CAPA). 

Introversidn. Disposicidn de personalidad tran- 
quila, reservada, de “ratdn de biblioteca". 

Inventario de estudio del temor. Instrument 
de evaluacidn conductual que requiem que 
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aquellos que lo responden indiquen la prc- 
scncia c intensidad de sus tcmores en rela- 
ciOn con diversos est/mulos, por lo comun 
en una escala tipo Likert de 5 o 7 puntos. 

Inventario de intercses. Prueba que mide la 
preferencia por ciertas acti vidades o temas 
y, por tanto, ayuda a determinar la clecciOn 
ocupacional. 

Juicio actuarial. Tipo de juicio automatizado 
en el que se utiliza una fOrmula derivada 
cmpfricamente para diagnosticar o predc- 
cir la conducta. 

Juicio clfnico. Tipo de juicio en el que la per¬ 
sona que toma la decision procesa la 
informaciOn dentrode su cabeza para diag¬ 
nosticar o predeeir la conducta. 

Ley Publica 93-112. Una "declaration de de- 
rechos” para las personas con discapacidad 
que proscribe la discriminaciOn con base 
en cl impediment. 

Ley Publica 94-142. Decreto de Education 
para Todos los Ninos con Discapacidades 
(Ley Publica 94-142), que ordena que los 
escolancs con impediments reciban eva- 
luaciOn apropiada y oportunidades educa- 
tivas. 

Ley Publica 99-457. Legislation que requiere 
que los estados proporcionen educaciOn pu¬ 
blica gratuita y apropiada para los nirtos 
discapacitados de 3 a 5 anos de edad. 

Libertad de la distractibilidad. Tcrcer factor 
del WISC-III que consiste de AritmOtica y 
RetenciOn de Digits. 

Lista de verificaciOn de incidentes criticos. 

Forma de evaluation del desemperio basa- 
da en episodios rcalcs de conducta desea- 
ble e indeseable en el trabajo. 

LObulo frontal. Parte de la corteza cerebral al 
frente del cerebro que se requiere para la 
programaciOn, regulation y verificaciOn de 
las funciones ejecutivas y de la ejecuciOn 
motora. 

Lobulo limbico. Crupo de estructuras sub- 
corticales responsablcs de la elaboracibn 


de la emociOn y el control de la actividad 
visceral. 

Lbbulo occipital. Parte de la corteza cerebral 
en la parte trasera del cerebro que contiene 
los centros de la visiOn. 

LObulo parietal. Parte de la corteza cerebral 
que media la inlegraciOn espacial y la con- 
cicncia sensorial de lo que succde en la su- 
perficie del cuerpo. 

Lobulo temporal. Parte de la corteza cerebral 
implicada en el procesamiento de las sen- 
sacioncs auditivas, almacenamiento de me- 
moria a largo plazo y modulaciOn de 
impulsos biolOgicos como agresiOn. temor 
y sexualidad. 

Locus de control. Construct que sc rcficre a 
las pcrccpciones que tienen las personas 
accrca de la fuente de aquello que les su- 
cede (p. ej., intemo contra extemo). 

Mai de Parkinson. Patologfa cerebral 
degenerativa caracterizada por tres tipos 
de trastornos motores: movimientos 
involuntarios, que incluyen temblor; pobre- 
za y lentitud de movimientos. sin llegar a 
paralisis; y cambios en postura y tono 
muscular. 

Manual del usuario. En pruebas, el manual 
que proporciona las instrucciones para apli- 
caciOn y que tambiOn provee las pautas para 
interpretaciOn de la prueba. 

Manual tlcnico. En pruebas, el manual que re¬ 
sume los datos tccnicos de un nuevo ins- 
trumento. 

Matriz de correlaciOn. Tabla completa de 
intercorrelaciones entre todas las variables, 
la cual es el punto inicial del andlisis 
factorial. 

Matriz factorial. Tabla de correlaciones entre 
variables y factorcs; Ostas se denominan 
cargas factoriales. 

Matriz multirrasgo-multimltodo. Diseno de 
investigaciOn paraevaluar validezconver- 
gente y de discrimination que requiere de 
la evaluaciOn de dos o mds rasgos a travOs 
de dos o mas metodos. 
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Mecanismos de defensa. Estrategias menta- 
les inconscienles disponiblcs para el yo 
cuando cnfrenta las demandas conflictivas 
del ello, supcryd y la realidad externa. 

Media. Promedio aritmitico dc un grupo de 
calincaciones. 

Mediana. Puntuacidn a la mitad dc todas las 
calificacioncs clasificadas. 

Medula osea. Parte del mctencdfalo quc ayuda 
a mcdiar los reflejos de tragar, vomitar, res- 
pirar; control de la presidn sangufnca, 
respiracidn y, cn parte, frecucncia cardiaca. 

Mcsencefalo. Portion media del ccrebro quc 
incluyc ncrvios craneales y estaciones de 
rclevo para la visirin y audicidn. 

Metencifalo. Estructuras ccrebralcs mis bajas 
y dc organizacidn mis simple. 

Mitodo de concordancia empirica. Metodo 
de desarrollo dc escalas en el que los 
reactivos de las pruebas se seleccionan por 
completo con base cn qud tan bicn difcrcn- 
cian a un grupo criterio dc una mucstra nor¬ 
mal iva. 

Mctodo de elecciin forzosa. En el desarrollo 
dc pruebas de personalidad, mdtodo dc 
redaccidn de los reactivos en los quc se 
equiparan las altcrnativas en cuanto a 
deseabilidad social. 

Mltodo de esealamiento absoluto. Procedi- 
miento para obtener una medida dc la difi- 
cultad absoluta con base en los resultados 
de grupos de individuos de diversas edades. 

Mctodo de esealamiento racional. Metodo de 
construccidn de escalas en el que todos los 
reactivos sc correlacionan cn sentido posi- 
tivo unos con otros y tambidn con la califi- 
cacidn total de la escala; asimismo se le 
conoce como enfoque de consistencia in¬ 
terna. 

Mitodo de intervalos de aparicion balancea- 
da. Metodo para construir escalas a nivel 
intcrvalo a parti r de afirmaciones sobre ac- 
titud. 

Moda. Puntuacidn de ocurrencia mis frccucnlc. 


Modelo integrativo. Modelo de evaluaci6n de 
carrera en el que se considera de manera 
simultinea la informacidn sobre las ireas 
de intereses, capacidad y pcrsonalidad. 

Modelo RIASEC. Teorfa de tipos persona-am- 
biente que propone seis temas: Realista, In- 
vestigador, Artfstico, Social, Emprendedor 
y Convencional (RIASEC). 

Muestra conductual. En pmebas, el concepto 
de que una prueba sdlo es una muestra de 
conductas que permite que el evaluador 
haga infercneias accrca dc un dominio mis 
amplio de conductas rclacionadas. 

Muestra de cstandarizacidn. Grupo dc gran 
tamano de individuos representatives dc la 
poblacidn a la que se dirige la prueba. 

Muestra de trabajo. Proccdimicnto de evalua- 
ci6n que utiliza una riplica en miniatura 
del trabajo que han solicitado los indivi¬ 
duos examinados. 

Muestreo alcatorio estratificado. Eslratcgia 
de seleccidn en la que los individuos se eli- 
gen dc manera aleatoria, con restricciones 
de que la mucstra sc cquiparc a la pobla- 
ci6n en cuanto a variables antecedentes rc¬ 
lacionadas como raza, sexo, ocupacidn, etc. 

Muestreo aleatorio. Estrategia de seleccidn en 
la que existe igual probabilidad dc sclcc- 
ci6n para todos los individuos. 

Multimedia. Capacidad colectiva de las 
computadoras modernas para utilizar imi- 
genes fijas, segmentos de video en vivo, 
miisica, cuadros, grifleas, animacidn y 
otros enfoques en un formato intcractivo. 

Neuropsicologia. Estudio de la relacidn entre 
funcidn cerebral y conducta. 

Nivel basal. Para las pruebas cn las que los 
reactivos de una subprueba se distribuyen 
del mis ficil al mis dil'fcil, es el nivel bajo 
al cual es casi seguro que el individuo eva- 
luado responderi correctamente a todas las 
preguntas. 

Nivel superior. Para las pruebas en las que los 
reactivos de una subprueba se distribuyen 
del mis ficil al mis diffcil, el nivel por en- 
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cima del cual cs casi seguro que el indivi- 
duo evaluado fallard en todas las siguicntes 
preguntas. 

No culpable en razdn de insaniu (NCRI). Un 
veredicto que se admite en algunos esta- 
dos de EUA en el que se encuentra no cul¬ 
pable al acusado dcbido a habcr cometido 
el acto criminal como resultado de cnfcr- 
rnedad o defecto mental. 

Norma de grado. Un tipo de cslandarizacidn 
que rcpresenta el nivel de desempcfio en 
una pmeba para cada grado escolar por se- 
parado en una mucstra normativa. 

Norma por edad. Tipo de cstandarizacidn que 
representa el nivel de desempeiio en una 
prucba para cada grupo independientc por 
edad, dentro de la muestra normativa. 

Normas de subgrupo. Normas obtenidas dc 
un subgrupo identificado, en contraposi- 
cidn a una mucstra nacional diversiflcada. 

Normas locales. Normas obtenidas de una 
muestra local rcprcsentativa, en contrapo- 
sicidn a una muestra nacional. 

Normas. Rcsumcn de resultados de una prue- 
ba para un grupo amplio y representative 
de personas. 

Ojiva normal. Distribucidn normal graficada 
en forma acumulativa. 

Organization perceptual. Segundo factor en 
el WISC-HI que incluye Ordenamicnto de 
Dibujos, Figuras Incompletas, Discnos con 
Cubos y Ensamble de Objetos. 

Paralingiiistica. Aspectos no verbalcs del ha- 
bla, como tono de voz y tasa dc expresidn 
verbal. 

Parcs crancales. Doce pares dc vfas 
ncuronalcs que ayudan a gobemar las fun- 
ciones scnsoriales y motoras bdsicas, como 
visidn, olfato, movimientos faciaies, gusto 
y audicidn. 

Patron conductual tipo A con propensidn a 
la cardiopatia. Patrdn de conducta con- 
sistente en inseguridad acerca del cstatus, 
agresividad excesiva, hostilidad libre flo- 


(antc y un sentido de urgencia en cuanto al 
tiempo (enfermedad de la prisa). 

Patroncs de reforzadores ocupacionales. Va- 
loracion de los puestos en tdrminos de los 
reforzadores pcrcibidos por el trabajador, 
que estdn presentes o ausentes. 

Pcnsamicnto divergente. Tipodc pensamiento 
que va en diferentes direcciones. 

Perccntil. Porcentaje de personas en la mues¬ 
tra dc estandarizacidn que tuvieron califi- 
caciones por debajo de una puntuacidn 
natural especffica; los percentiles varfan de 
Oa 100. 

Personalidad. Constructo no cxplfcito que se 
usa para explicar la consistencia conductual 
dentro dc las personas y la inconsistencia 
conductual entre individuos. 

Polfgono dc frecuencias. Mdtodo para resu- 
mir los datos o calificacioncs dc una prue- 
ba en forma dc grdfica; similar a un 
histograma, excepto que la frccuencia dc 
los intervalos de clase se representa con 
puntos en vcz de columnas. 

Polfgrafo. Instrumento que registra respues- 
tas fisioldgicas en proccso, incluycndo 
cambios en respiracidn, frecuencia respi- 
ratoria, presidn sangufnea y transpiracidn; 
conocido de mancra inadccuada como 
“detector de mentiras". 

Preocupaciones externas a la validcz. Efec- 
tos colaterales y consecuencias no 
intencionales de las pruebas. 

Problcma de criterio. El diffcil problcma dc 
concepluar y medir conslructos rciaciona- 
dos con el desempeiio laboral que con fre- 
cuencia son complejos, confusos y 
multidimensionales. 

Proccdimicnto conductual. Procedimiento 
para evaluar los antecedentes y consecuen¬ 
cias de la conducta; incluye listas de veri- 
ficacidn, escalas de calificacidn, cnlrevistas 
y observaciones estructuradas. 

Procedimiento dc estandarizacion. En prue¬ 
bas. cl intento, a travds de instruccioncs cui- 
dadosamente estrictas, de asegurar que los 
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procedimientos para aplicacidn de una pruc- 
ba son uniformes de un examinador y arn- 
biente a otro. 

Proccdimicnto de manejo dc contingencies. 
Enfoque de terapia conductual en cl que el 
terapeuta identifica y altera las consecuen- 
cias de las conductas indcseables. 

Proccsamiento simultaneo. Forma de proce- 
samiento de informacidn caracterizada por 
la ejecucidn simultinca de varies operacio- 
nes mentalcs difercntes. 

Proccsamiento sucesivo. Forma de procesa- 
miento dc informacidn en cl que debe se- 
guirse una secucncia apropiada de 
operaciones mcntales. 

Production divergcntc. Creacidn de numero- 
sas respuestas apropiadas para una sola si- 
tuacidn estfmulo. 

Propension de respuesta de descabilidad so¬ 
cial. Tcndencia de las personas examina- 
das a reaccionar ante la deseabilidad (o 
indeseabilidad) percibida de un reactivo de 
prueba en lugar de responder de modo pre- 
ciso a su contenido. 

Proscnccfalo. Porcidn grande, externa del cc- 
rebro que incluye a la cortcza cerebral y 
estructuras subyacentcs como el cuerpo ca- 
lloso, ganglios basales, ldbulo Ifmbico, td- 
lamo c hipotdlamo. 

Prueba. Proccdimicnto estandarizado para to- 
mar una muestra dc conducta y describirla 
con categorias o califtcacioncs. Ademds, 
la mayor parte de las pruebas tienen nor- 
mas o estdndares con base en los cuales 
pueden utilizarse los resultados para pre- 
decir otras conductas mas importantes. 

Prueba adaptativa computarizada. Familia de 
procedimientos que permiten la evaluacidn 
precisa y cficaz de la capacidad; se conti- 
nua con la prueba individualizada hasta que 
se alcanza un nivel predeterminado dc pre- 
cisidn en la medicidn. 

Prueba culturalmcnte justa. Prueba disena- 
da para reducir al mfnimo las influencias 


del aprendizaje cultural y del clima social y, 
por tanto, producir una separacidn mds de- 
finida entre la capacidad natural y el apren¬ 
dizaje cspecffico. 

Prueba de aptitud. Prueba que midc uno o 
mds segmentos definidos de modo claro y 
relativamente homogdneos dc capacidad. 

Prueba de creatividad. Prueba que evalria la 
capacidad para producir nuevas ideas, dis- 
cemimientos o creacioncs artfsticas acep- 
tadas como valiosas a nivel social, estdtico 
o cientffico. 

Prueba de evitacidn conductual. Procedi- 
miento conductual en el que el terapeuta 
midc cudnto tiempo cl individuo puede to- 
lerar un estfmulo productor de ansiedad. 

Prueba de integridad abierta. Prueba dc em- 
pleo que busca evaluar las actitudes hacia 
cl robo; estos instrumentos pueden conte- 
ner tambitfn una seccidn que trata sobre la 
admisidn abierta del mismo. 

Prueba de integridad. Instrumento disenado 
para dctectar a emplcados potenciales en 
cuanto a propensidn al robo y otras cuali- 
dades indcseables; las pruebas explfcitas dc 
integridad conticncn preguntas sobre acti¬ 
tudes en cuanto al robo y rcactivos que 
tratan dc la admisidn del robo y de otras 
actividades ilegalcs. 

Prueba de inteligencia. Aunque existen excep- 
ciones, en general una prueba dc este tipo 
produce una calificacidn general resumida 
que se basa en los resultados dc una mues¬ 
tra hetcrogdnea de reactivos (p. ej., habili- 
dades verbales, razonamiento, pensamiento 
espacial). 

Prueba de personalidad. Prueba que mide los 
rasgos cualidades o conductas que deter- 
minan la individualidad de una persona; 
esta informacidn ayuda a predecir la con¬ 
ducta future. 

Prueba de podcr. Prueba que concede el sufi- 
ciente tiempo a la persona examinada para 
hacer el intento de resolver todos los 
rcactivos; no obstante, la prueba tiene la 
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suficiente dificultad como para que ningu- 
no de los individuos que la responda pueda 
obtencr una calificacidn perfecta. 

Prueba de rendimiento. Prueba que midc el 
grado de aprendizaje, dxito o logro en una 
materia. 

Prueba de velocidad. Prueba cronometrada 
que conticnc reactivos de nivel de dificul¬ 
tad uniforme y simple en terminos genera- 
les: el lfmite de tiempo es suficientemente 
estricto como para que pocos individuos 
terminen la prueba cronometrada. 

Prueba directiva. Subprueba inicial utilizada 
para determinar cl nivel de entrada para 
todas las subpruebas restantes; utilizada 
con pruebas individuales de inteligencia 
como la SB:CE. 

Prueba ipsativa. Prueba en la que el prome- 
dio de las subescalas es siempre el mismo 
para todos los individuos examinados; asf, pa¬ 
ra uno determinado, las calificacioncs altas 
en las subescalas deben equilibrarse con 
aquellas bajas en otras subescalas. 

Prueba proyectiva. Prueba en la que la per¬ 
sona evaluada se enfrenta con estimulos 
vagos y ambiguos, y responde con sus pro- 
pias construccioncs. 

Prueba referida a criterio. Prueba en la que 
el objetivo consistc en determinar en qu6 
sitio se coloca la persona evaluada con res- 
pecto a objetivos educativos definidos de 
manera muy estrecha; no se hace ninguna 
comparacidn con el desempeiio de otros in¬ 
dividuos evaluados. 

Prueba referida a normas. Prueba en la que 
el desempeiio de cada individuo examina- 
do se interpreta con referenda a una mucs- 
tra relacionada de cstandarizacidn. 

Pruebas de rendimiento individual. Pruebas 
aplicadas de modo individual para cstimar 
los nivelcs de rendimiento; dstas son esen- 
ciales en la evaluacidn de posibles disca- 
pacidades para el aprendizaje. 

Pruebas grupales. Medidas principalmente de 
Idpiz y papel adecuadas para examinar a 


grandes grupos de personas al mismo 
tiempo. 

Pruebas grupales de rendimiento. Tambidn 
llamadas pruebas de rendimiento educati- 
vo, estos instruments se aplican por lo co- 
mun a docenas o cientos de estudiantes al 
mismo tiempo para cstimar los nivelcs de 
rendimiento en una o mds areas academi- 
cas bien dcfinidas. 

Pruebas individuates. Instruments que por 
su diseno y propdsito deben aplicarse a una 
persona. 

Pruebas neuropsicoldgicas. Pruebas y proce- 
dimientos con sensibilidad probada a los 
cfectos del dafio cerebral. 

Psicologia del consumo. Rama de la psicolo- 
gfa industrial y organizacional que trata del 
desarrollo, promocidn y mercadeo de pro- 
ductos y servicios. 

Psicomctrista. Especialista en psicologia o edu- 
cacidn que dcsarrolla y evalua pruebas psi- 
coldgicas. 

Puntuacion estandar normalizada. Puntua- 
ci6n obtenida por una transformacidn que 
traduce una curva sesgada en una distribu- 
ci6n normal. 

Puntuacion estandar. Puntuacidn transforma- 
da en la que la calificacidn original se cx- 
presa como la distancia con respect a la 
media en unidades de desviacidn estdndar. 

Puntuacion natural. Nivel mds bdsico de la 
informacidn proporcionada por una prue¬ 
ba psicoidgica; porejemplo, numcrode pre- 
guntas respondidas de manera correcta. 

Puntuacion T. Puntuacion transformada con una 
media de 50 g desviacidn estdndar de 10. 

Puntuacion verdadcra. La puntuacidn hipo- 
tdtica real de un individuo examinado en 
una prueba; la puntuacidn verdadcra puc- 
de cstimarse de modo probabilfstico, pero 
nunca se conocc directamente. 

Rapport. En pruebas, una atmdsfera edmoda y 
cdlida que sirve para motivar a los indivi¬ 
duos examinados y producir coopcracidn. 
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Rasgo. Cualquier mancra rclativamcntc dura- 
dera en la que un individuo difiere de otro. 

Rasgos fuente. Fuentcs cstables y constantcs 
de la conducta que son menos visibles que 
los rasgos superficiales, pero mas impor- 
tantes para explicar la conducta. 

Rasgos supcrficiales. En la teorfa de Cattcll, 
los aspectos mas obvios de la personalidad 
que surgen por lo comun en las primeras 
etapas del andlisis factorial cuando los 
reactivos individuals de una prueba se 
cnrrclacionan entre sf. 

Realidad virtual. Utilizacidn de imageries ela- 
boradas por computadora que se proycc- 
tan en gafas que rodean la cabeza para 
representar un ambiente tridimensional, 
cambiante, en movimiento. 

Reduction de la validez. Dcscubrimicnto co¬ 
mun en la investigacidn de validacidn cru- 
zada de que una prueba predice de manera 
menos precisa cl criterio rclacionado con 
la nueva muestra de personas evaluadas que 
con la del piloteo original. 

Regia del Codigo Penal Modelo. Estdndar de 
demcncia legal - “Una persona no es rcs- 
ponsable de conducta criminal si al momcn- 
to de dicha conducta, como resultado de 
enfermedad o defecto mental, carccc de la 
capacidad sustancial ya sea para apreciar 
la criminalidad [incorreccidn] de su con¬ 
ducta o para conformar su conducta a los 
requisitos de la ley”. 

Regia Durham. La disposicidn legal para la 
defensa de insania si el acto criminal fue 
“producto” de enfermedad o dcfecto men¬ 
tal; se descartd cn 1972 y se le reemplazb 
con el Cddigo Penal Modelo. 

Religidn como Busqueda. La perspectiva de 
que la complejidad, duda y vacilacidn son 
aspectos de la expresidn religiosa madura. 

Restriction del rango. Fendmeno en el que se 
restringe el rango de una variable, lo cual 
produce que las correlaciones con otras va¬ 
riables sean artificialmcnle bajas. 

Rctraso mental. Funcionamicnto intclectual 
general que se encuentra significati vamente 


por debajo del promedio y que rcsulta en o 
se relaciona con la discapacidad concurrcn- 
te en conducta adaptativa y se manificsta 
durante cl periodo del desarrollo. 

Rotation a estructura simple. En andlisis 
factorial, mdtodo para rotar la matriz 
factorial que busca simplificar las cargas 
factoriales de modo que cada prueba tenga 
cargas significativas en el menor numero 
de factorcs posible. 

Rotacion a multiple positivo. En andlisis 
factorial, mdtodo para rotar la matriz fac¬ 
torial que busca climinar tantas cargas 
factoriales negativas como sea posible. 

Sesgo de una prueba. En su uso popular, una 
prueba estd sesgada si discrimina de ma¬ 
ncra injusta en contra de minorfas raciales 
y dtnicas, mujeres y personas en situacidn 
de pobreza; a ni vel tdcnico, el sesgo de una 
prueba se refiere a la validez diferencial 
para subgrupos definiblcs y relacionados 
de personas. 

Sesgo del calificador. Tendencia a que las ca- 
lificacioncs del supervisor scan imprecisas 
debido a indulgcncia, se veridad y otros erro- 
res de medicidn. 

Sesgo en la validez de constructo. Tipo de ses¬ 
go que ocurre cuando sc demuestra que una 
prueba mide diferentes rasgos hipotdticos 
(constructos psicoldgicos) para un grupo 
que para otro o mide el mismo rasgo, pero 
con distintos grados de prccisidn. 

Sesgo en la validez de contenido. Tipo de 
sesgo que se demuestra cuando un reactivo 
o subeseala es relativamente mds diffeii 
para los miembros de un grupo que para 
los de otro, despuds de mantener cons- 
tantc cl nivel general dc capacidad de am- 
bos grupos. 

Sesgo en la validez prcdictiva. Tipo de sesgo 
demostrado cuando la infcrencia obtenida 
dc la calificacidn de una prueba no se rea¬ 
lize con el menor error aleatorio razonable 
o cxiste un error constante en la inferen¬ 
ce o predict'i(in en funci6n de la membresfa 
a un grupo en particular. 
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Sesgo. La simetrfa o asimetrfa de una distribu- 
cidn dc frccucncias; cl sesgo positivo indi- 
ca que las calificaciones se encuentran 
agrupadas en el extremo bajo, el sesgo ne- 
galivo indica quc dstas sc encuentran agru¬ 
padas en el extremo alto. 

Sfndrome alcoholico fetal. Conjunto de anor- 
malidades ffsicas y conductuales que inclu- 
ycn retraso mental, producidas por el hecho 
de quc la madre ingiera alcohol durante el 
embarazo. 

Superyo. En la teorfa psicoanalftica, aquella 
parte de la personalidad que es aproxima- 
damcnte sindnimo dc concicncia y que 
incluye las normas sociales dc lo que es 
correcto e incorrecto trasmitidas por los 
padres. 

Tabla de especificaciones. En el desarrollo de 
pruebas, un cuadro que lista cl numero 
exacto de reactivos en areas de contcnido 
relacionadas; una labia de este tipo tam- 
bidn especifica cl ndmero preciso dc 
reactivos que deben reprcscntar difercntes 
proccsos cognitivos. 

Talamo. Estructura clave que proporciona en- 
trada sensorial e informacidn acerca dc mo- 
vimicnto en progrcso a la corteza cerebral; 
el talamo es la principal cstacidn de relevo 
en el ccrebro. 

Talcntos espcciales. La dcsignacidn de una per¬ 
sona como talentosa significa quc por lo 
comun tiene una capacidad extraordinaria 
en alguna drca. 

Tasa base. En la teorfa de decisidn, la propor- 
cidn de solicitantes cxitosos que pucden 
seleccionarse utilizando los mdtodos habi- 
tuales, sin el beneficio de la nucva prueba. 

Tccnica de bandeja de entrada. Prueba de una 
mucstra realista de trabajo quc Simula el 
ambicntc laboral de un administrador. 

Tecnica Q. Tdcnica para el estudio de cambios 
en cl autoconcepto y otras variables mc- 
diante la clasificacidn dc afirmaciones en 
una distribucidn casi normal para catego- 
rfas asignadas. 


Teorfa clisica de mediddn. Teorfa dominantc 
en las pruebas psicoldgicas; supone que una 
calificacidn observada consta de una califi- 
cacidn vcrdadeni mds un error dc mcdi- 
cidn. 

Teorfa de decisi6n. Enfoque de medicidn psi- 
coldgica que considera los costos y bene- 
ficios de las decisiones basadas en la prueba; 
por ejemplo, en la seleccidn de personal. 

Teorfa de la capacidad para la generaliza- 
cion. Modelo de confiabilidad del muestreo 
dc un dominio que reconoce varias alter- 
nativas para la generalizacidn de resulta- 
dos de una prueba. 

Terapia cognitiva conductual. Enfoque de 
cambio conductual que enfatiza la modift- 
cacidn de la estructura de creencias del 
cliente. 

Terapia conductual. La aplicacidn de los m 6- 
todos y descubrimientos de la psicologfa 
experimental para la modificacidn de la 
conducta dcsadaptada; iambien se le llama 
modificacidn conductual. 

Teratdgeno. Sustancia que atraviesa la barrera 
placentaria y produce deformidades ffsicas 
en el feto. 

Testigo experto. En juicios legates, un tcstigo 
que cl juez considera calificado para testi- 
ficar acerca dc un tema determinado. 

Trastomo por deficit de atencidn con hiper- 
actividad. Sfndrome conductual caracteri- 
zado por intranquilidad, distraccidn, 
impulsi vidad, deficit de atencidn, habilida- 
des sociales deficientcs e incapacidad para 
considerar las consecuencias. 

Validacidn cruzada. En el caso de pruebas 
predictivas, la pr£ctica de utilizar la ecua- 
ci6n de regresidn original en una nueva 
mucstra para dcterminar si la prueba pro- 
dice el criterio tan bien como lo hizo en la 
mucstra original. 

Validacidn ilusoria. En pruebas proyectivas, 
cl descubrimiento de que los individuos ig- 
noran las instancias de desconfirmacidn y 
se adhieren a s as estereotipos preexistentes. 
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Validez concurrente. Tipo de validez relacio- 
nada con el criterio cn la que se obtienen 
las mcdidas de criterio aproximadamente 
al mismo tiempo que las calificacioncs de 
una prueba. 

Validez convergence. Tipo de validez que sc 
demuestra cuando una prueba se 
coiTelaciona en gran medida con otras va¬ 
riables o pruebas con las que compartc una 
supcrposicidn de constructs. 

Validez de construct. Tipo de validez que se 
reficre a la idoncidad de las inferencias ba- 
sadas en la prueba cn cuanto al construct 
subyacente que 6sta se propone medir. 

Validez de contenido. Tipo de validez que sc 
determina por el grado cn que las pregun- 
tas, tarcas o reactivos de una prueba son 
representatives del uni verso de conducta 
del que 6sta tiene el prop6sito de ser una 
mucstra. 

Validez de discriminacidn. Tipo de validez que 
se demuestra cuando una prueba no se 
correlaciona con variables o pruebas con 
las cuales deberfa diferir. 

Validez de Facie. En el caso de pruebas, apa- 
riencia de validez para los usuarios de la 
prueba, examinadorcs y, en particular, para 
los individuos evaluados; no cs una forma 
tdcnica de validez, pero es importante para 
la aceptabilidad social de una prueba. 

Validez predictiva. Tipo de validez relaciona- 
da con el criterio en el que las medidas de 
criterio se obtienen en el futuro, en general 
meses o afios despuds de que se obtuvieron 
las calificaciones; por ejemplo, cuando se 


pronostican las calificaciones en la univer- 
sidad a partir del examen de ingreso, 

Validez relacionada con el criterio. Tipo dc 
validez que se demuestra cuando se pone 
en evidencia que una prueba es eficaz en 
la estimacidn del desempefio de una perso¬ 
na evaluada cn alguna medida de resultado. 

Validez. Una prueba es vdlida al grado en que 
las inferencias realizadas con base en clla 
sean apropiadas, significativas y utiles. 

Valor. Segun Rokcach y otros investigadorcs, 
una creencia compartida y duradera acerca 
de los modos idealcs dc conducta o esta- 
dos meta de la existencia. 

Valoracion para custodia. En casos de divor- 
cio la valoracidn psicoldgica dc un niflo (o 
niflos) y de ambos padres para ofrecer una 
opinidn ante cl tribunal sobre los intercses 
primordialcs de dstc (o 6stos) en relacidn 
con los arreglos de custodia. 

Valorcs laborales. Necesidades, motivos y va- 
lores que influyen la cleccidn vocacional. 
la satisfaccidn con cl puesto y el desarrollo 
de la carrera. 

Varianza. fndice estadfstico que refleja el gra¬ 
do de dispersidn cn un grupo de califica¬ 
ciones. 

Velocidad de proccsamiento. Cuarto factor del 
WISC-III que incluye Claves y Sfmbolos, 
y Digits. 

Ventriculos. Cavidades llenas de lfquido den- 
tro del cerebro. 

Yo. En la teoria psicoanalitica, si mismo cons- 
ciente que media entre el ello y la realidad. 
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Claves (subprucha Weclislcr). 224 a 225 
CM MS. Viase Columbia Menial Maturity Scale 
CMQ. Viase Cornnon Metric Questionnaire 
Codigo Penal Modclo, 457 
Coeficicnlc 
alfa. 105 

dc confiabtlidad, 99 a 100, 101 
dc correlncibn, 100 
dc pcrsonalidad, 591 
CogAT. Viase Cognitive Abilities Test 
Cognitive Abilities Test (Prucha dc Capacidadcs Cognos- 
cilivas). 251 a 254 


Cognitive Errors Questionnaire (Cucstionario dc Entries Cog- 
noscitivas), 652 


Columbia Mental Maturity Scale (Escala Columbia de Ma- 
durez Mental), 276 a 277 

Comisibn dc Oporiunidad Equitativa dc Emplco, 519 
Comitf de Examen dc Ingrcso a la Univcrsidad, 27, 28 
Common Metric Questionnaire (Cucstionario Mblrico Co- 


mdn). 482 


Compclcncia para cstar sujeto a juicio, 458 a 462 
Competency Assessment Instrument (Inslrumcnto de Evalua- 
cibn dc la Competence). 461 

Competency Screening Test (Prucba dc Dctcccibn dc la Com¬ 


pclcncia), 461 

Composicibn dc Objctos (subprucha Wecltslcr). 224 
Comprcnsibn (subprucha Wcchsler), 220 
Comrey Personality Scales (Escalas dc Pcrsonalidad Comrcy) 
627 a 629 7 

"Con Trastorno Emocional Grave”, 443 
Conducta no verbal. 655 a 660 
Confiabilidad, 93 a 114 


caracterfsticas incstablcs y, 109 
cocficicntc alfa cn, 105 
fbrmula Kudcr-Richardson 20 cn. 106 
intcrcaltficadorcs, 106 
interprctacibn dc, 110 a III 
por mi lades. 103 a 104 
praebas referidas a criterio y. 110 
restriccibn del rango y, 110 
test-retest, 102 
y error de mcdtddn, 94 a 99 
cslindar, III a 114 
Confidenaalidad. 691 
Conmocibn cerebral, 397 

Conners ’ Teacher Rating Scales (Escalas Conners dc clasifi- 
cacibn del Maestro). 441 
Conscntimicnto informado, 692 a 693 
Conscrvacibn, 179 
Consuncia dc Cl, 216 
Conslruccibn dc pruebas. 143 a 166 
Constructo, 131 

Contaminacibn del criterio, 123, 515 a 516 
Continuous Performance Test (Prucba dc Dcscmpcflo Conti¬ 
nue), 395 a 396 
Concccibn de conjcluras, 59 
Corteza cerebral, 372 a 374 
CPI. Viase Invcntario Psicolbgico dc California 
CPS. Viase Comrey Personality Scales 
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CPT. Viase Conlhuiotis Performance Tex! 

Crcatrvrdad, 447 
Critcrio, 122 
Cruz Griega, 405 

CST. Viase Competency Screening Text 
CTRS. Viase Conners' Teacher Rating Scales 
Cuadru dc cxpectativas, 87 
Cucrpo caltoMJ. 371 a 372 
Cucslionario 

dc Rstilos de Atribucidn, 652 
dc Pcrsonalidad ilc Eysenck. 626 a 627 
Culture Fair Intelligence Test (Prucba dc Intcligcncia Cullu- 
ralmemc Justa). 254 a 256 
Cuotas (justicia cn las pruebas). 301 
Curva rcactivo-caractcrfstica. 158 a 159 

D 

DAB-2. Viase Diagnostic Achievement Battery-2 
DAS Viase Differential Ability Scales 
DAT Viase Test dc Aptitudes Difcreivctalcs 
Datos biogriftcos, 483 a 485 
Dccreto 

dc 1991 sobre Dcrechos Civilcs. 523 
de Educacidn para Individuos con Discapacidadcs, 429 
sobre los cstadounidcnscs con discapacidadcs, 266 a 267, 
523 

Dcfmicidn(cs) 

opcracionalcs, 170 
real, 170 

Defining Issues Test (Prucba dc Cuestioncs Dctcrminanlcs), 
562 a 563 

Dcincncia. 381. 382 
Dcnvcr-ll, 422 a 423 
Dcsviacidn csUindar. 74 
Deicccidn. 45, 420 

Detroit Test of learning Aptitude-4 (Prucha Detroit dc Apti- 
tud para cl Aprcndizajc-4), 238 a 240 
Developmental Indicators for the Assessment of Learning-} 
(Indicadorcs del Dcsanollo para la Evaluacidn del Aprcn- 
dizajc-3), 196 

Developmental Indicators for the Assessment of Learning- 
Revised (Indicadorcs del Dcsanollo para la Evaluacidn 
del Apecndizaje-Rcvisados). 421 
DFH. Viase Prucba del Dibujo dc la Eigura Humana 
Diagnostic Achievement Battery-2 (Hatcria dc Diagndstico 
del Rcndimicnto-2), 435, 436 
Diagndslico, 46 

DIAL-3. Viase Developmental Indicators for the Assessment 
of Learning-} 

DIAL-R. Viase Developmental Indicators for the Assessment 
of Learning-Revised 
Difcrcncias 

individuals, 6% 
raciales y Cl, 308 a 312 

Differential Ability Scales (Escalas dc Capacidad Difcrcncial), 
206 a 208 

Discapacidadcs para cl aprendtraje. 46,428 a 435.437 a 438 
Discno 

con Cubos (subprueba Wcchsler), 222 a 223 
longitudinal, 314 
transccucncial, 314 
transversal. 313 


Dispraxia dc construccidn, 385 
Distribucidn 

dc frccuencias. 72 a 73 
normal, 74 a 76 

E 

Party Screening Inventory (Invcntario de Detcccido Tcm- 
prana). 196 

Parly Screening Profiles (Pcrfilcs dc Dctcccidn Tcnipr.uia), 196 

EAS. Viase Employee Aptitude Survey 

Econotnfa dc fichos, 650 

Ecuacidn dc regresidn, 125 

Pducatirmal Testing Service, 358 

Fitnvrds Personal Preferences Schedule (Invcntario Edwards 
de Prefcreneta Personal). 616 a 619 
EEC) Viase Elcctrocncefalografia 

EEOC Viase Comisidn dc Oporlunidad liquilativa dc Emplco 
Efccto 

alcoltdlico fetal, 307 
dc Halo. 514 a 515 
del Lago Wobegon. 359 

EFcQ. Viase Examinee Feedback Queslitmnaire 
EIWN-R PR. Viase Escala Wcchsler dc Intcligcncia para Ni- 
nos-Rcvisada dc Puerto Rico 
Ejcrcicio situacional. 500 
Ejes 

oblicuos, 330 
ortoganales, 330 

El Yo y los Mccanismcts dc Dcfcnsa, 579 
Elcctrocncefalografia. 387 

Employee Aptitude Survey (Estudio de Aplitud del Emplca- 
do). 497 a 498 

Encucsta dc Valorcs dc Rokcach, 557 a 558 
Entrcnamicnlo, 64 
Entrcvista, 485 a 487 

EPPS Viase Edwards Persrmal Preferences Schedule 
EPQ. Viase Cueslionario dc Pcrsonalidad de Eysenck 
Era dc las instrumcnlas de broncc. 5 a 7 
Ertar(cs) 

adminislralivos cn la califrcacibn, 65 

dc medicidn, 94 

cstlndar, 

dc la difcrcncia. 114 
dc mcdicidn. 112 
del cstimado, 125 a 126 
sistcmiiico dc medicidn. 97 a 98 
Escala(s) 

Binct-Simon dc 1905, 13 a 15 
Binel-Simon de 1908 y 1911. 14 a 15 
traduccidn dc Goddard para las, 20 
y pruebas con imnigrantes. 20 a 22 
C, 84 

dc califrcacidn grifrca, 510 a 511 
dc Dccisioncs Profcsionalcs. 549 
de clcccidn forzosa, 512 
dc cstaninas. 83 a 84 
dc estenes, 83 a 84 
de intcrvalo, 145 
dc iuicio Moral. 560 a 561 
dc razdn, 146 
dc Valorcs. 547 a 548 
Guttman, 150 

hjipticu dc intcligcncia para adultos invidentes, 278 
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Liken, iso 

McCarthy de Aptitudes y Psicomotricidad para Nirtos. 204 
a 206 

ordinalcs. I4S 

Rogers de Evnluacidn de la Rcsponsabilidad Criminal. 
458. 459 

TUFA W ase Time Urgency and Perpetual Activation 
Scale 

Wechslcr dc Inteligencia. 

■Bellevue, 76, 215 
para Adullos-lll. 226 a 230 
para el Nivel Escolar-lll, 230 a 232 
para los Nivcles Prccscolar y Pnmaria-Rcvisada. 197 
a 198 

para Niftos-Rcvisada dc Puerto Rico. 701 
ESI. Ve'ase Early Screening Inventory 
ESP Vfase Early Screening Profile .» 

Espccificidad. 422 
Esqueinos. 179 
Estado mental 

al momento dc cometcr el Delito, 455 
examen de. 413 
Estdndar dc cuidado, 693 
Estudio dc Valores. 30. 556 a 557 
EUA contra Georgia Power. 520 
Evaluaci6n. 40 

condoctual. 645 a 660 
del Desarrollo dc Nirlos Pcquctlos. 196 
psicoldgica asistida por computadora. 664 
Examen 

Army Alfa, 24 a 27 
Army Beta. 24 a 27 

y difcrcncias Arnicas, 27 
de estado mental, 413 
scnsopcrceptual. 393 • 

Examinee Feedback Questionnaire (Cuestionano dc Rcali- 
mcntacidn del Examinado). 163 
Experimental Pxycliology, 8 
Exprcsidn facial, 658 
Extravcnsidn, 627 

F 


Factor general dc inteligencia (©g*)> 175 
16 Factories de la Pcrsonalidad (16FP), 623 a 625 
Fagan's Test of Infant Intelligence (Prueba Fagan dc Inteh- 
gencia para Lactantcs), 211 

Faith Maturity Scale (Escala de Mndurcz dc la Fc), 570 a 572 
Fatsos negativos, 127 
Fatsos positivos, 127 

Fear Survey Schedule (Invcntario dc Estudio del Tcmor). 648 
Figuras Incompletas (subprueba Wechslcr), 221 
Finger Localitalion Text (Prueba dc Localizacidn dc Dcdos), 
393. 394 

Finger Tbppmg Text (Pruclxs dc Ciolpctco con los Dcdos), 102,409 
FMS Vfase Faith Maturity Scale 
Formacidn reticular, 367 
Fdrmula 

Kudcr-Richardson 20. 106 
Spearman-Brown, 104 
Frye contra EUA. 453 

FTII. Viaxe Fagan 'x Test of Infant Intelligence 


FIT. Wn.se Finger Tapping Test 

Fuld Object-Memory Evaluation (Valoracidn Fuld dc Mcmo- 
ria de Objctos), 401 
Funciones 

cerebrates del hemisferio dcrccho, 385 a 386 
ejecutivas, 406 

G 


Ganglios basalcs. 371 

GATB. Ware General Aptitude Test Battery 
OCDAS. Wore Gesell Child Development Age Scale 
GED. Vfase Test of General Educational Development 
General Aptitude Test Battery (Balcria dc Prueba de Apti- 
lud General), 333 a 335 

General Work Inventory (Invcntario dc Trahajo General), 482 
GcnAtica c inteligencia, 302 a 304 
Geriatric Sentence Completion Form (Forma Gcriitrica 
dc Frascs Incompletas), 602 

Gesell Child Development Age Scale (Escala Gesell de 
Edad del Desarrollo Infantil), 196 
GMndula pineal, 369 

Graduate Record Exam (Examen dc Selcccidn para 
Posgrado), 342 a 343 
Griggs contra Duke Power, 518, 519 
Grooved Pegboard Test (Tablcro Pcrforado para Clavi- 
jas). 410 

Grupo normalivo, 70 
norma por edad cn, 86 
normas locales y de subgrupo cn. 86 a 87 
GWI. Wo.se General Work Inventory 

H 


Habilidades psicomotrices, 497 

Halstead-Rcitan Test Battery (Balcria dc Prucbas Halstead- 
Reilan). 394 
Head Start, 46 
Hereditary Genius, 7 
Hipocampo. 370 
Hipotillamo, 370 
Hipdlcsis 

lexica fundamental. 588 
proycctiva. 594 

Hiskey-Nebraska Test of Learning Aptitude (Prueba Hiskcy- 
Nebraska de Apttlud para el Aprcndiraje), 272 
Histograma. 73 

HIT. Wore Hohtman Inkblot Technique 
Hoja dc Datos BiogrAficos, 29 

Hohtman Inkblot Technique (TAcnica Holuman dc Man- 
chas de Tinta). 599 a 600 

llinne Observation for Measurement of the Environment 
(Obscrvacidn en cl Hogar para la Medicidn del Aro- 
biente), 423 a 428 

Home Situations Questionnaire (Cucstionario dc situacio- 
nes hogarenas), 444 

Hopelessness Scale (Escala dc Dcsespcranza), 652 
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IDARE. Vfase Invcntario dc Ansiedad Rasgo-Eslado 
IDEA Vfase Decrclo dc Educacidn para Individuos con 
Discapacidadcs 

1LBC. Vfase Independent Living Behavior Checklist 
Imigcncs por rcsonancia magnittica, 387 
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Independent Living Behavior Checklist (Lista etc Vcrifica- 
ci6n de la Conducla dc Vida lndcpcndicnte). 283 
fndicc 

dc confubilidad del icactlvo. 157 
dc dificullad del rcaclivo, 156 
de discriminacidn del rcaclivo. 159 a 161 
dc hereditabilidad, 302 
dc validcz del rcaclivo. 157 a 158 

lndividunlismo 

cualificado (justicia cn las pruebas), 301 
no cualificado (justicia cn las pruebas), 300 a 301 
Informacidn (subprueba Wechslcr). 218 
Informes de licmpos cn telescopio, 6 
Inquiries into Human Faculty and its Development, 7 
Inteligencia. 169 a 189 

basada cn la experiencia. 187 
cambios de. con la edad, 312 a 316 
cambios gcneracionalcs c, 317 a 320 
componcncial, 186. 187 
contextual, 188 

contribucioncs gen<licas a la, 302 a 304 
cristalizada, 178 
deftniciones dc. 170 a 174 
difcrcncias raciales cn, 308 a 312 
cfectos sobre la, 

ambientales, 304 a 308 
tcralogdmcos, 307 a 308 
factores cn, I7S 
fluida. 178 

modelo dc la Estructura Intclectual cn, 180 a 182 
polcncial cvocado promedio e. 184 
proccsamicnto simultinco y succsivo en, 182 a 183 
social, 550 
tcorla de, 

multiple. 185 a 186 
triilrquica. 186 a 189 
Intcraccidn visual. 656 a 657 
International Health Exhibition dc 1884, 7 
Intcrpretacidn 

de los SueAos, S77 
de prueba basada cn sistemas. 665 
Introversion, 627 
Invcntario(s) 

dc Ansicdad Rasgo-Estado, 622 a 623 
dc Pcrsonalidad dc Thurstone, 29 
dc Valorcs, 559 a 560 
Gcscll del Dcsairollo, 192 a 193 
Multiaxial Cltnico dc Millon-11, 638 a 639 
Multifisico dc la Pcrsonalidad de Minnesota. 30, 630. 
631, 667, 669 

Mullifisico dc la Pcrsonalidad dc Minnesota-2. 630 a 
638 

NEO dc Pcrsonalidad-Revisado. 629 
Psicoldgico dc California, 494. 636 a 638 
Tipoldgico dc Tipos dc Myers-Briggs, 621 
Iowa Tests of Basic Skills (Pruebas Iowa dc Habilidadcs 
Bisicas), 351 a 352 

Iowa Tests of Educational Development (Pruebas Iowa dc 
Dcsairollo Educalivo), 352 a 354 
IRM Viase Imigcnes por rcsonancia magntflica 
ITBS Viase Iowa Tests of Basic Skills 
ITED. Viase Iowa Tests of Educational Development 

J 


Jackson Wtcaiional Interest Survey (Encucsta Jackson de 
Inter Os Vocacionat), 532 a 533 


JAS Viase Jenkins Activity Survey 
Jenkins Activity Survey (Encucsta Jenkins de Actividad), 621, 
622 
Juicio 

actuarial. 669 
cUnico, 669 
Justicia dc prueba 
cuotas y. 301 
c mdividualismo, 
cualificado, 301 
no cualificado, 300 a 301 
JVIS. Viase Jackson Vocational Interest Survey 

K 

K-ABC Viase Bateria dc Evaluacidn Kaufman para Niflos 
K A IT Viase Kaufinan Adolescent atui Adult Intelligence Test 
Kaufman Adolescent and Adult Intelligence Test (Prueba Kauf¬ 
man dc inteligencia para adolcsccntcs y ndultos), 214 
Kaufman Test of Educational Achievement (Prueba Kaufman 
de Rcndimienlo Educalivo). 435 a 437 
K-BIT. Viase Test Breve dc Inteligencia dc Kaufman 
KGIS, Viase Kuder General Interest Survey 
Kohs Blork Design Test (Prueba dc DiseAo con Cubos dc 
Kohs), 22 

K-TEA Viase Kaufman Test of Educalimal Achievement 
Kuder General Interest Survey (Encucsta dc Intcrcscs Gene¬ 
rates de Kuder), 32, 533 a 534 

L 


Laberintos (subprueba Wcchsler), 225 
Law School Admission Test (Prueba dc Admisidn a la Facul- 
tad de Lcyes), 344 

Leiler International Performance Scalc-Heviscd (Escala In- 
lernacional Lcitcrdc Ejccucidn-Revisada), 267 a 269 
Lcnguajc como funcion del hemisfeno izquicnlo, 383 a 385 
LesiOn(cs) 

cerebral trnumitica. 5, 380 
personates. 469 a 470 
Ley Publics 93-112, 264 
Ley Publics 94-142. 265 a 266 
Ley Publics 99-457, 266 

Line Tracing Task (Tarca de Trazado dc Linens), 410 
Lista de vcrificacidn dc incidcntes crfticos, SI0 
LNNB Viase Luria-Nebraska Neuropsychological Battery 
L6bulo(s) 

fronlales. 378 
limbico, 370 a 371 
ocdpitales, 375 
parietales, 375 a 377 
tcmporales. 377 a 378 
Locus dc control, 586 
LSAT. Viase law School Admission Test 
Liria-Nebraska Neuropsychological Battery (Diagndstico 
Ncuropsicoldgico Luria-Nebraska). 410 a 413 

M 

MAB. Viase Multidimensional Aptitude Battery 
Mai dc Parkinson. 371, 381 a 382 
Mancjo dc contingcncias. 650 
Manual del usuario, 165 
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MAT. Ware Prucba Mclropolilan dc Rcndimicnto 
Matrices (subprucba Wcchslcr), 223 
Matrices Progrcsivas dc Raven, 256 a 259 
Matrix 

dc corrclacidn, 323 a 324 
factorial, 325 a 326 
muliirrasgo-niullimiftodo, 135 
MBA Ware Mini Buttery of Achievement 
MBT1 Wave Invcntario Tipolrigico dc Tipos dc Myro-Briggv 
MCAT. Wove Medical College Admission Test 
MCMI-II. Ware Invcntario Multiaxi.il CMnko dc Millon-ll 
MCT. Ware Minnesota Clerical Test 
Measures for Clinical Practice: A Sourcebook, 49 
Mecanismos dc defensa, 579 a 580 
Media, 73 
Mcdiana, 73 

Medical College Admission Test (Prucba dc Admisidn a la 
Facultad de Mcdicina). 343 a 344 
Mcdidas dc atencirSn y concentracidn, 441 a 442 
Mfdula 6sea, 366, 368 
Mcjorcs intcrcscs del clicntc, 690 a 691 
Mental Measurements Yearbook, 48 
Mental Tests and Measurements, 2, 8 
Mcscncdfalo, 368 
Mctcncdfalo. 366, 368 
Mtftodo 

dc concordancia cmplrica. ISO a 151 
dc cscalamicnlo, 145 a IS2 
absolute, 149 a ISO 
racional, ISI a 152 

dc intervales dc aparicidn balanccada. 148 a 149 
Miner Sentence Completion Scale (Escala Miner dc ora- 
cioncs incomplctas). 602 

Mini-Battery of Achievement (Mimbatcria dc Rcndimicmo) 
435. 436 

Mint-Mental Stale Examination (Examcn dc Estado Mini- 
mental), 414 a 417 

Minnesota Clerical Test (Prucba Minnesota dc Trabajos de 
Oftcina), 491 a 492 

Minnesota Importance Quesliimnaire (Cucstionano Minne¬ 
sota dc linportancia), 544 a 546 
Minnesota Rale of Manipulation Test (Prucba Minnesota 
dc Tasa dc Manipulacidn), 498 
Minorias culturales y lingdlsticas, 697 a 702 
MIQ Ware Minnesota Importance Questionnaire 
MM PI Ware Invcntario Multif.lsico de la Personalidad 
dc Minnesota 

MMPI-2. Wave Invcntario Multifsisico dc la Personalidad 
dc Minncsota-2 

MMSE. Ware Mini-Mental State Examination 
Moda, 73 

Modclo RIASEC, 535 

MSCA. Ware Escalas McCarthy dc Aptitudes y Psicomo- 
tricidad para Ninos 

MSO. Ware Estada mental al momenta dc comctcr cl IJclilo 
Mucstra 

dc estandari/acidn, 39 
dc trabajo. 499 
Mucslrco alcalorio. 85 
eslraliricado, 85 

Multidimensional Aptitude Battery (Batcria Multidimcn 
sional dc Aplitud). 246 a 249 
Multilingual Aphasia Examination (Examcn MullilingUc 
dc la Afasia). 404 
Multimedia, 674 

Myarl contra Motorola. 518 a 519 
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National Teacher Examination (Examcn Nacional para 

Maestros), 357 

NEO-PI-R. Ware Invcntario NEOde Pcrsonalidad-Rcvisado 

Ncuropsicologia, 364 

Nivclcs dc medicidn. 145 a 146 

No culpable a causa dc insama, 455 

Normas tineas y profcsionalcs. 686 a 696 

NTE. Ware National Teacher Examination 
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OAI. Ware Occupation Analysis Inventory 

Occupatiim Analysis Inventory (Invcntario dc Anllisis Ocu- 
pacional), 482 

Ordenacidn dc Dibujos (subprueba Wcchslcr), 222 
Ordinal Scales of Psychological Development (Escalas Or- 
dinalcs dc Dcsarrollo Psicol6gico), 194 

P 

Paced Auditory Serial Addition Task (Tarea Rinnica Audiliva 

dc Suma cn Scric), 396 a 397 
Paradoja proyectiva, 594.612 a 613 
Paralinguistics, 657 

Parent-Child Relationship Inventory (Invcntario dc Rclacio- 
ncs Padres-Hijo). 467 
Parcs crancalcs, 369 

PASAT Ware Paced Auditory Serial Addition Task 
Patrdn conductual Tipo A con propensidn a la cardiooalia 
582 a 583. 622 

Paulas Uniformcs para la Selection dc Personal, 520 a 522 
Peabody Individual Achievement Test-Revised (Prucba Pea¬ 
body dc Ejccucidn Individual-Rcvisada). 435. 436 
Peabody Picture Vocabulary Test-Ill (Prucba Peabody de 
Vocabulanocon Figures-III). 274 a 276 
Pcrccntil, 77 a 78 

Perrcplitm-of-Relalionsliip Test (Prucba dc Pcrccpcidn dc 
Rclacioncs), 468 
Personalidad, 576 a 577 

Personality Inventory for Children (Invcntario dc Pcrsonali- 
dad para NiAos), 639 a 641 

Personality Projection in the Drawing of the Human Figure, 31 
Personality Research Form (Forma dc Invcstigacidn dc la 
Personalidad). 618 a 621 
FES. Ware Pleasant Events Schedule 
PIAT-R Wave Peabody Individual Achievement Test-Revised 
PIC Ware Personality Inventory for Children 
PICA, Ware Porch Index of Cimununicalive Ability 
Picture Projective Test (Prucba dc Ldininas Proycctivas), 606 
a 607 

Placer, principle del, 578 

Pleasant Events Schedule (Invcntario de Acontccimientos 
Placemans), 654 

I’MPQ Ware Professional and Managerial Position Ques¬ 
tionnaire 

Polfgono dc frccucncins. 73 
PONS. Ware Profile of Nimverbat Sensitivity 
Porch Index of Communicative Ability (Indicc Porch dc Ha- 
bilidad de Comunicacidn). 404 
PPVT-lll. Ware Peabody Picture Vocabulary Test-Ill 
PRF. Ware Personality Research Form 
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Problcma del criterio, 508 
Produccidn divergente, 182, 447 

Professional ami Managerial Position Questionnaire (Cues- 
lionano dc Pucstos Profcsionalcs y Gerencialcs). 482 
Profile of Nonverbal Sensitivity (Pcrfil de Scnsibilidad No 
Verbal). 658 a 660 

Programa dc eximenes universitarios. 356 

Proscncdfalo, 369 

Prucba(s) 

adaptalivas cotnpuiarizadas. 679 

Bennett dc Comprcnsidn Mccinica, 490 a 491 

Benton dc Rctcncidn Visual. 401 

culturalmcnte justas, 259 a 260 

de aprovccharaicnlo, 42 

dc aptilud. 28 a 29, 42 

dc bandeja dc entrada. 500 a 501 

dc crcatividad. 42 

dc Fichas. 404 

dc frascs incomplctas, 601 a 604 
de integridad, 494 a 496 
dc intcligcncia, 41 

No Verbal-3, 272 a 273 

validez prcdictiva dc. con laclanlcs y prccscolarcs. 

208 a 210 

dc Intcrpirlacidn dc Formas dc Rorschach. 30,31,595 a 599 
dc la habilacidn inclinada y la silla inclinada, 47 
dc opcidn multiple, 154 a 155 
dc pollgrafo. 470 a 472 
dcfinicidn dc, 36 a 39 
del Dibujo dc la Figura Humana. 609 a 611 
cfeclos del cntrcnamienlo sobre las, 64 a 65 
futuro dc la aplicacidn dc. 680 a 682 
Gestalt dc Bender, 404 
grupalcs, 23 a 27, 40. 243 a 261, 347 a 360 
dc rcndimicnto. 347 a 360 
individuates, 40 

dc rcndimicnto, 348 
ipsativa. 618 

Metropolitan dc Rendimiento, 352 
no vet bales a pnncipios del siglo xx, 22 
nonnas o esUindarcs cn, 38 
proccdimicnto cstandarizado cn, 37 
proycctivas, 593 a 613 
psicoldgicas, liistoria dc las, I a 33 
quiin puede obtener las. 37 
refendas a criterio, 88 a 89, 348 a 349 
referidas a la norma, 348 a 349 

contra referidas al criterio, 39. 348 a 349 
Wondcrtic dc Personal, 489 a 490 
Psicologla forcnsc. 451 a 474 
Psiedmetra, 36 
Puntuaci6n(cs) 
cstdndar. 78 a 82 

normaluadas. 82 a 83 
naturales, 70 a 72 
T, 80 a 82 
verdadcra, 38. 94 
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Rapport. 60 
Rasgofs). 587 
fuente. 588 
supcrficialcs, 587 


R-CRAS. Vtase Escalas Rogers dc Evaluaridn dc la Respon- 
sabilidad Criminal 
Realidad 

principio dc. 578 
virtual. 675 

Registro dc Prcfcrcncias dc Kuder. 32 
Regia dc Durham. 456 
Regia M'Naughlcn. 456 

Retiun-lndiana Aphasia Screening Test (Prueba Rcitan-lndia- 
na dc Deteccidn tie la Afasia), 403 
Rclacioncs ccrcbro-conducla, 364, 392 a 393 
Rcligidn como busqueda. 566 a 568 
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